统计陷阱 How to Lie with Statistics 达莱尔哈夫著 廖颖林译 刘汗良校 上海财经大学出版社 -1
- 1 - 统计陷阱 How to Lie with Statistics 达莱尔·哈夫 著 廖颖林 译 刘汗良 校 上海财经大学出版社
有3种谎言:谎言、糟糕透顶的谎言和统计资料。 -Disrael 对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。 -H.G.Wells 使我们陷入麻烦的通常并非我们不知道的事情,而是那些我们知道却不正确的事情。 -Artemus Wand 整数总是不完善的。 -Samuel Johnson 我需要完成一个很大的课题一一统计学,但却感到我的写作功底十分有限,如果不牺牲准 确性和完整性,就很难使人理解。 -Sir Francis Galton -2
- 2 - 有3种谎言:谎言、糟糕透顶的谎言和统计资料。 ——Disraeli 对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。 ——H. G. Wells 使我们陷入麻烦的通常并非我们不知道的事情,而是那些我们知道却不正确的事情。 ——Artemus Wand 整数总是不完善的。 ——Samuel Johnson 我需要完成一个很大的课题——统计学,但却感到我的写作功底十分有限,如果不牺牲准 确性和完整性,就很难使人理解。 ——Sir Francis Galton
致谢 散见在本书中的关于狡辩和欺诈的小例子经过了广泛的收集,并得到了人们的许 多帮助。在我对美国统计学会发出呼吁后,许多专业统计学家 一请相信我,他们和 任何人一样痛恨对统计资料的溢用 一从他们自身收集的资料中为我提供了大量的实 例。这些人,我猜想,将乐意不被提到姓名。同样,我在许多书籍中发现了有意义的 事例,主要的书籍有:Martin A.Brumbaugh和Lester S.Kellogg所著的《商业统计学》: Hadley Cantril的《公共观点的测定》:Willard Cope Brinton的《统计图》:Frederick E.Croxton和Dudley J.Cowden的《实用商业统计学》:George Simpson和Frit Kafka的《基础统计学》以及Helen M.Walker的《基础统计方法》 3
- 3 - 致谢 散见在本书中的关于狡辩和欺诈的小例子经过了广泛的收集,并得到了人们的许 多帮助。在我对美国统计学会发出呼吁后,许多专业统计学家——请相信我,他们和 任何人一样痛恨对统计资料的滥用——从他们自身收集的资料中为我提供了大量的实 例。这些人,我猜想,将乐意不被提到姓名。同样,我在许多书籍中发现了有意义的 事例,主要的书籍有:Martin A. Brumbaugh和Lester S. Kellogg所著的《商业统计学》; Hadley Cantril 的《公共观点的测定》;Willard Cope Brinton 的《统计图》;Frederick E. Croxton 和 Dudley J. Cowden 的《实用商业统计学》;George Simpson 和 Fritz Kafka 的《基础统计学》以及Helen M. Walker 的《基础统计方法》
目录 绪言 第一章内在有偏的样本 1 第二章精心挑选的平均数 16 第三章没有披露的数据一 -21 第四章毫无意义的工作 29 第五章惊人的统计图形 33 第六章平面图形 第七章不相匹配的资料 名 第八章相关关系与因果关系 48 第九章如何进行统计操纵 54 第十章对统计资料提出的五个问题- -65 -4
- 4 - 目录 绪言 -5 第一章 内在有偏的样本-7 第二章 精心挑选的平均数- 16 第三章 没有披露的数据- 21 第四章 毫无意义的工作- 29 第五章 惊人的统计图形- 33 第六章 平面图形 - 37 第七章 不相匹配的资料- 42 第八章 相关关系与因果关系 - 48 第九章 如何进行统计操纵- 54 第十章 对统计资料提出的五个问题- 65
绪言 我岳父刚从爱荷华州到加利福尼亚州便对我说:“你们这儿治安不好。”在他所阅读的报 纸中的确是这样描述的。但是,这种报纸以不轻易忽略当地发生的任何犯罪行为,并且以对于 爱荷华州发生的谋杀案用比爱荷华州本地的主要报纸更多的笔墨进行大肆渲染而闻名。 我居父得出的这个结论是一个建立在明品有偏样本基础之上的贿音的统计结论。类似干甘 他某些更为精致的统计结论,它也存在着证据与结果不匹配的问题。它假定报纸专栏中对犯罪 行为的报道是测量犯罪率的工具。 几年前,十来个调查人员分别独立地发表了关于抗组织胺药物的数据。所有的数据都证明, 在经过抗组织胺药物治疗后相当大比例的感冒能够治愈。这引起了传媒的大肆宜传,至少在广 告中也是如此,并兴起了药物生产的热潮,这是因为人们长期以来对药物具有强烈的需求。但 奇怪的是,人们拒绝越过统计去注意一下早就了解的事实 一位幽默的非医学权威人士, 亨利·G·菲尔森(Henry G.Felsen)所指出的那样,服用上述药物的确能在 星期内治愈 感冒,但人们却忽略了另一个事实一一即使不服用上述药物,一般而言,感冒也能在七天内痊 愈。 分终。致。虽然经验诉我们眼见为实 你所见所闻的许多东西也和上面的事例一样。平均数、作用关系、趋势和图表与看上去的 并不 但眼睛告诉我们的也许隐瞒了或者夸大了 统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用并 成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民 意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确理解 并恰当地使用这些统计语言, 而读者又并不能真正懂得这些术语的含义,那么,统计结果只能 是一堆废话。 在通常的科学写作中充斥着被溢用的统计数据,以至于人们很难想到这些统计数据的背后 有一个“白衣侠客”在昏暗的灯光下没日没夜地工作,就像一小撮药粉、一小瓶颜料,统计把 一些重要的事实弄得似是而非。巧妙伪装的统计资料胜过希特勒的弥天大谎,虽然它也会引起 -5
- 5 - 绪言 我岳父刚从爱荷华州到加利福尼亚州便对我说:“你们这儿治安不好。”在他所阅读的报 纸中的确是这样描述的。但是,这种报纸以不轻易忽略当地发生的任何犯罪行为,并且以对于 爱荷华州发生的谋杀案用比爱荷华州本地的主要报纸更多的笔墨进行大肆渲染而闻名。 我岳父得出的这个结论是一个建立在明显有偏样本基础之上的随意的统计结论。类似于其 他某些更为精致的统计结论,它也存在着证据与结果不匹配的问题。它假定报纸专栏中对犯罪 行为的报道是测量犯罪率的工具。 几年前,十来个调查人员分别独立地发表了关于抗组织胺药物的数据。所有的数据都证明, 在经过抗组织胺药物治疗后相当大比例的感冒能够治愈。这引起了传媒的大肆宣传,至少在广 告中也是如此,并兴起了药物生产的热潮,这是因为人们长期以来对药物具有强烈的需求。但 奇怪的是,人们拒绝越过统计去注意一下早就了解的事实。正如一位幽默的非医学权威人士, 亨利·G·菲尔森(Henry G. Felsen)所指出的那样,服用上述药物的确能在一个星期内治愈 感冒,但人们却忽略了另一个事实——即使不服用上述药物,一般而言,感冒也能在七天内痊 愈。 你所见所闻的许多东西也和上面的事例一样。平均数、作用关系、趋势和图表与看上去的 并不总是一致。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的也许隐瞒了或者夸大了一 部分事实。 统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用并 成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民 意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确理解 并恰当地使用这些统计语言,而读者又并不能真正懂得这些术语的含义,那么,统计结果只能 是一堆废话。 在通常的科学写作中充斥着被滥用的统计数据,以至于人们很难想到这些统计数据的背后 有一个“白衣侠客”在昏暗的灯光下没日没夜地工作,就像一小撮药粉、一小瓶颜料,统计把 一些重要的事实弄得似是而非。巧妙伪装的统计资料胜过希特勒的弥天大谎,虽然它也会引起