当前位置: 100md首页 > 医学版 > 医学资料 > 资料下载2021
编号:1821
一眼识破真相的思考力.pdf
http://www.100md.com 2020年1月16日
第1页
第6页
第19页
第25页
第46页
第284页

    参见附件(8862KB,285页)。

     一眼识破真相的思考力是作家丹尼尔·列维汀博士写的关于思维逻辑的书籍,包含了变幻莫测的数字,猜不透的文字游戏,理解世界的逻辑三个部分。

    一眼识破真相的思考力内容简介

    网上信息纷繁复杂,里面充斥着各种各样的虚假与谬误,它们往往会借助数字、语言和逻辑的力量来达到欺骗性目的,让你不知不觉被误导、蒙蔽。为此,认知心理学大师丹尼尔·列维汀博士提供了一个强大的思维训练工具,教你快速识别信息时代的各种陷阱,避免落入它们的圈套。面对信息轰炸,要保持清醒,就需要培养自身的批判性思维,熟练应用诸如贝叶斯法则等科学工具,检查信息的合理性和来源的可靠性,揭穿隐藏其中的谬误,厘清信息的真相。这是一本写给聪明人看的书,送给渴望拥有理性的你。

    一眼识破真相的思考力作者简介

    丹尼尔·列维汀博士(Daniel J. Levitin)加拿大麦吉尔大学心理学教授,同时也是行为神经科学、信息科学学院和教育学院的特聘教授。曾在斯坦福大学教授计算机科学,并担任过多家企业的咨询顾问,包括美国电话电报公司、布兹-爱伦-汉密尔顿咨询公司、苹果公司、索尼、美国富国银行等等,面向学生、企业领导者等广泛人群。著有畅销书《有序:关于心智效率的认知科学》《迷恋音乐的大脑》《传唱世界的六首歌》,他的书被翻译成21种语言。其中《迷恋音乐的大脑》为麻省理工学院、加州大学洛杉矶分校的指定课堂教材,并被列入哈佛大学的通识教育核心计划指定阅读书目。

    一眼识破真相的思考力章节预览

    第一部分变幻莫测的数字

    第1章数字的合理性

    第2章平均数的妙用

    第3章数轴的诡过

    第4章恶搞数字汇报

    第5章收集数字的方法

    第6章神奇的概率

    第二部分猜不透的文字游戏

    第7章我们如何认知

    第8章不可轻信专家的意见

    第9章被低估的可替代解释

    第10章似是而非的反知识

    第三部分理解世界的逻辑

    第11章科学运作的原理

    第12章 逻辑谬误

    第13章通晓未知

    第14章神通广大的贝叶斯思维

    第15章有关真相的4个案例

    一眼识破真相的思考力截图

    本书由“PDF 电子书网”整理

    PDF 电子书网(www.xgv5.com):免费提供各类精品

    电子书的网站!PDF 电子书网提供的书籍绝对可以当

    得起你书架上的一席之地!总有些书是你一生之中

    不想错过的!

    好读书,读好书,找好书就到 PDF 电子书网 www.xgv5.com

    www.xgv5.com

    PDF 电子书网所有书籍全部免费分享,只为以书会

    友,欢迎大家支持!

    一眼识破真相的思考力

    [美]丹尼尔·列维汀 著

    张建军 译

    中信出版集团

    2

    目录

    序言 人人都要批判性思考

    第一部分 变幻莫测的数字

    第1章 数字的合理性

    第2章 平均数的妙用

    第3章 数轴的诡计

    第4章 恶搞数字汇报

    第5章 收集数字的方法

    第6章 神奇的概率

    第二部分 猜不透的文字游戏

    第7章 我们如何认知

    第8章 不可轻信专家的意见

    第9章 被低估的可替代解释

    第10章 似是而非的反知识

    第三部分 理解世界的逻辑

    第11章 科学运作的原理

    第12章 逻辑谬误

    第13章 通晓未知

    第14章 神通广大的贝叶斯思维

    第15章 有关真相的4个案例

    3

    结语 发掘适合自己的思维方式

    致谢

    附录 贝叶斯法则的应用

    术语表

    4

    谨以此书献给莎莉,其勤学好问、刻苦钻研的精神激励我成

    为一名更优秀的思考者。

    5

    序言

    人人都要批判性思考

    当前,人类文明中的谎言正以一种前所未有的趋势发酵、扩散。这

    些谎言甚至能够化作武器,潜移默化地削弱我们做出正确决策的能力。

    这种现象体现在两个方面:第一,我们的语言究竟是在论述事实,还是

    在编造事实,已经日渐扑朔迷离,让人难以分辨;第二,民众教育的匮

    乏,如今已对整整一代人造成了影响,情况十分危险。

    那么,我们的语言到底经历了怎样的变化?在《牛津词典》公布的

    2016年度热词榜中,“后真相”一词因其使用频率激增而荣登榜首,这个

    词意指“相对于主观情感及个人信念,客观事实对民意的影响相对较

    小”。在这样一个“后真相”时代,我认为我们需要付诸行动,抵制那些

    虚构、隐瞒真相的观点和结论,让“真相”尽快回归。

    面对谎言,我们或许有些过于谨小慎微。也许是为了避免冲突,也

    许是为了所谓的“相处融洽”,我们在提及那些完全疯狂而荒谬的事情

    时,便使用一些更加委婉的词语来替代。以曾经的一个谎言事件为例:

    当时,“后真相”一词刚刚荣获年度热词的称号;仅仅数日之后,2016年

    12月4日,星期日,来自美国北卡罗来纳州小城索尔兹伯里的28岁青年

    埃德加·M. 韦尔奇驱车350公里,从家乡来到首都华盛顿,闯入一家叫

    作“彗星乒乓”的比萨店并持枪射击。后续调查发现,该青年此举是被某

    个谎言误导——当时有谎言称:这家比萨店正暗中运作着以希拉里·克

    林顿为首的性奴交易勾当。《纽约每日新闻》形容这则谎言为“边缘化

    理论”。这种说法实在有失缜密。众所周知,一项理论,不仅仅是某个

    简单的想法,而是某种在对证据进行准确评估的基础上得出的认识;至

    6

    于那些证据,必然要同当前问题密切相关,必然需要人们以一种公正、严谨的方式去收集和采纳,而非随口杜撰而来。

    另外一些替代“谎言”的委婉词语还有:“反知识”“真假参半”“极端观

    点”“扭转真理”“阴谋论”等,而近来频频出现的就是“假新闻”。

    “假新闻”这个词略显戏谑,简直就像小学生为了逃避考试而假装生

    病骗大人的小把戏。它无法清晰地向大家揭露事实,比萨店的性奴交易

    事件就是一个彻头彻尾的谎言。该事件的杜撰者十分清楚这一点。事情

    普遍存在两面性,但是,只要其中任何一面涉及谎言,那么其两面性就

    不成立。当一个事件的对立面并非以事实为基础时,那么记者以及其他

    民众就不应该继续给予该对立面相同时间的关注;当事件的正反面皆有

    证据支持时,它的两面性才成立。有了证据支持,进而权衡证据并以此

    得出结论,人们自然而然会对事件的认知产生分歧。每个人都有权利发

    表自己的观点,但是他们无法将自己的观点立为事实。谎言是事实的缺

    失,更多时候,谎言与事实截然不同。

    真相至上。而“后真相”时代的来临可谓荒谬至极,人类取得的所有

    伟大进步正在一步步走向颠覆、破灭。在这个时代,记者们不情愿

    将“假新闻”称作谎言,因为他们不敢冒犯说谎者。而我在此呼吁各位,要将矛头直指那些说谎者!斥责、抨击他们!我们需要真相!

    说到这里,让我们思考一个问题:在步入“后真相”时代的进程中,我们的教育系统和相关机构又出现了哪些问题呢?小学二年级之后,学

    生平均阅读图书的数量每年一直在减少。[1]

    早在15年前,美国教育部就

    已经觉察到,超过20%的美国成年人甚至无法在文字中寻找到需要的信

    息,用他们的话来说就是“无法利用印刷材料做出低级推论”。[2]

    显然,我们没能教会孩子们什么是证据,以及如何对其做出判断——我们理应

    感到羞愧。那个被假新闻误导的年轻人埃德加·M. 韦尔奇,“彗星乒

    乓”比萨店的持枪匪徒,甚至声称“在网上浏览到那条消息后,我就开始

    7

    进行调查了”。是的,我们的信息基础设施已经相当完备,信息媒介的

    力量如此强大,它能够给我们带来正面影响,也会造成负面伤害,所以

    我们每个人都要懂得如何区分这些信息,学会分辨真相和谎言。

    韦尔奇自认为他正在进行所谓的“调查”,但是真正的调查需要获取

    证据。这位无知的公民并不知道该如何收集证据并以此做出评估和判

    断。针对该案件,真正的调查应该从这些方面入手:寻找希拉里·克林

    顿和这家比萨店之间的某种潜在联系;关注希拉里有哪些行为表现出了

    对运作卖淫集团的兴趣;或摸索希拉里能以这种方式获得何种利益——

    当然不会是经济利益,毕竟当时的混乱局势已经让她赚取了巨额的演讲

    费。如果那家比萨店有儿童性奴和恋童癖者进进出出,或许韦尔奇也可

    以观察到。在调查过程中,如果个人在心理和学识方面有所欠缺,则可

    以浏览一些经验丰富的专业调查记者关于该事件的评论。虽然很多事实

    证明,专业记者也不值得信任,甚至有些人认为记者都已腐败堕落,他

    们和政府沆瀣一气——这样的想法可以理解,但是美国劳工统计局的报

    告显示美国有45790名报道员和通讯员[3]

    ,美国新闻编辑协会估计有

    32900名记者分布在美国大约1400家日报社[4]。所以,即便一些记者已

    经丧失职业道德,这个群体也如此庞大。我们应该相信,真相还是掌握

    在大多数人手中。

    社交网站脸谱网(Facebook)作为当今社会信息的重要来源,正在

    努力履行它的社会责任。脸谱网表示,公司已经着手推进一项举

    措:“让我们的18亿用户可以更加容易地举报假新闻”。[5]

    换句话说,就

    是撕掉谎言的伪装,让民众看到:谎言就是谎言。今后,也许其他社交

    媒体网站会逐渐担当起管理者的角色,呈现给社会更多的真相;我们至

    少可以期待,对于那些如同武器一般具有杀伤力的危险谎言,这些网站

    能够采取筛查措施,降低它们传播、扩散的可能性。

    针对上述比萨店事件,许多新闻机构也曾做过调查,试图追溯性奴

    丑闻谎言的来源。美国全国广播公司曾报道称,在欧洲国家马其顿的韦

    8

    莱斯小镇,活跃着一个假新闻制造团体,它很有可能就是这条谎言的制

    造者。[6]

    新闻聚合网站BuzzFeed和英国《卫报》曾经发现,至少100个

    假新闻网站域名都来自这里。韦莱斯小镇的年轻人对于美国政党没有任

    何政治立场,他们整日忙于制造各种建立在谎言之上的新闻事件,发布

    在脸谱网等网络平台上,通过读者每一次的点击从广告商那里赚取大笔

    的费用。在一个经济机会有限的小镇,青少年却能以这种方式赚到数万

    美元。谁应当对比萨店的枪击事件负责呢?这些年轻人?那些社交网络

    平台?使美国公民满足于每日见闻的教育体系?

    你可能会反对说:“对这些谎言进行批判性评估和统计又不是我的

    职责,这是报纸、博客、政府和维基百科的事。”是的,这些组织和机

    构有义务做这些事,但是它们往往心有余而力不足,事情也越来越棘手

    ——谎言数量的增加速度正在渐渐超过它们处理问题的速度。这更像一

    场打地鼠游戏。“比萨门”事件的点击量高达100多万,而Snopes网站上

    揭示该事件真相的文章的点击量只有3.5万。今天,我们拥有言论自

    由,但在历史上,大多数国家没有这种自由。所以,我们永远不应将媒

    体自由与真诚视为理所当然。记者和他们的雇主会继续帮助我们识别并

    消除谎言,但是我们不能仅仅依靠他们的力量——如果我们依旧盲目相

    信,毫无思考,那么谎言还是会占上风。

    我们大多数人当然不相信希拉里·克林顿在华盛顿特区的一个比萨

    店中管理性奴交易。本书要讨论的也不仅仅是此类谬论,还有更多值得

    关注的焦点。你真的需要这种新药吗?它耗资10亿美元的营销活动所呈

    现的带有偏差的伪数据让你动摇了吗?那位出庭受审的名人真的有罪

    吗?要如何判断呢?我们如何评估哪项投资获利更多?面对复杂矛盾的

    投票应该如何做出选择?还有什么事情因无法掌握更多的信息而超出我

    们的理解范围?

    面对种种狡猾的说谎者,最可靠的防备方式就是,每个人都要学会

    用批判性思维来看待问题。孩子们无法应付谎言的演变趋势——这是教

    9

    育的失败。人类作为社会物种,很容易相信他人的言论。人类的大脑是

    一台善于编造和虚构故事的机器。面对一个奇怪的假设,我们就能够在

    脑海中生成一系列天马行空的解释,幻想这个假设如何变成现实。其

    实,创造性思维和批判性思维之间、谎言和真相之间是有区别的:真相

    需要真实、客观的证据支持。只有真实的言论,才能呈现真正意义上的

    真相。

    斯坦福大学针对民众开展过一项为期18个月的在线推理研究调查,截至2016年6月,已经有7800多名学生参加了测试,他们的年龄分布在

    中学生到大学生之间。研究人员指出,测试结果有着惊人的一致性,令

    人沮丧。总的来说,在鉴别分析互联网信息方面,可以用一个词来概括

    年轻人——“愚蠢”。他们竟然很难把高质量的新闻和编造的谎言区分开

    来——这正是我们现在需要教授他们的技能;在这个过程中,我们也恰

    好可以温习这些知识。所幸,只要以正确的方式加以指引,即便让12岁

    的儿童进行基于证据的思考也不是一件难事。

    许多人认为,“比萨门”事件是由假新闻——我们还是称之为“谎

    言”吧——直接造成的后果。假新闻并非真正意义上的“新闻”。相信谎

    言也并不一定会受到伤害。我们都相信圣诞老人的存在,也都坚信新买

    的牛仔裤会让我们看起来更苗条。将谎言转化为武器的并不是媒体或脸

    谱网,真正的危险在于人的这种“相信”的强烈程度。如果人们盲目地过

    分相信谎言,那么它真的会给人带来伤害。

    批判性思维可以促使我们后退一步,对事实进行评估和判断,进而

    形成以证据为基础的结论。至于韦尔奇之所以在华盛顿的比萨店开枪射

    击,是因为他的观点可能是偏执的,而他没有能力理解这件事。谦卑是

    批判性思维至关重要的一部分,也是当今社会最为稀缺的品质。谦卑的

    概念简单而深刻:如果意识到我们并非知晓一切,那么就虚心学习吧。

    不知为何,我们的教育体系,我们对互联网的依赖,让一代又一代年轻

    人看不到自己的无知。如果我们能够接受这一事实,就可以引导人们的

    10

    思想,恢复文明,并且消除谎言对世界造成的威胁。这是推进繁荣的唯

    一途径。

    针对谎言的三个战略防御方式

    我从2001年开始写作本书,当时的我正在大学里教授一门关于批判

    性思维的课程。2014—2016年,我认真地研究了相关的问题。从那时

    起,谎言的危险程度和扩散范围就已经变得势不可当。谎言不再仅仅是

    无足轻重、可以一笑而过的东西,它已经成为一种无形的武器。情况可

    能会变得更糟,谎言有可能造成巨大的伤害,人们经历几个世代可能都

    无法察觉,也可能在导致灾难性后果之前烟消云散。

    信息的来源已经成为一个问题。在过去,和一些狂热分子在地下室

    用家用印刷机胡乱印刷的长篇大论不同,纪实性图书和新闻看起来是真

    实可信的。然而,互联网已经改变了这种情况。一家不正规的网站完全

    可以做得看上去和那些致力于求证事实的正规网站一样具有可信度——

    我在本书会提到这个例子。在互联网上,虚假信息和真实信息纠缠在一

    起,混淆视听。虚假信息如此混乱,它们散步于不同阶层、不同文化程

    度的人群之中,并且经常出现在你不希望看到它们的地方。通过推特、脸谱网、Snapchat、Instagram、汤梦乐(Tumblr)和其他社交媒体,虚

    假信息在世界范围内传播开来,变得众所周知。你会发现突然之间大多

    数人竟然都相信了某件事,尽管真相并非如此。

    本书可以帮助你找出你所遇到的关乎事实问题的关键,而这些关键

    很有可能引导你得出错误结论。有时,即使他人给你呈现事实真相,还

    是希望你得出错误结论;有时,他们自己也无法区分真伪。当今,信息

    具备即时性,国家领导人也可能出现在你的个人社交媒体中,每天甚至

    每个小时我们都能听到关于突发新闻的报道,但是我们什么时候能够抽

    出时间判断这些新消息是否充斥着伪事实、曲解或彻头彻尾的谎言呢?

    11

    我们需要有效的策略,判断、评估这些信息是否真实。

    在过去的5年中,我们创造了海量的信息,甚至超过之前人类历史

    上的信息的总和。在网站上、录像带中、书本里,还有社交媒体上,伴

    随真实信息而来的是大量的虚假信息和错误信息。这并非一个新出现的

    问题。在人类文明数千年的发展过程中,错误信息始终相伴人们左右,对此人们在“圣经时代”和古希腊时期都有所记载。[7]

    我们今天要面临的

    唯一问题是,错误信息已经开始泛滥,谎言有可能因社会和政治目的而

    变得像武器一般危险,这就迫使我们制定策略、采取措施防范谎言。

    在本书中,我会将这些策略进行归类。本书的第一部分涉及数字型

    错误信息。我会向各位展示错误的统计数据和图表会给我们提供一个扭

    曲的视角,进而引导我们得出错误结论,以致最终做出荒谬的决定。在

    第二部分,我们将分析一些错误的论证,指出通过充满感染力而实为误

    导的方式讲述那些偏离事实的故事,可以让人轻易具备说服力。我们应

    学习一些技巧来优化对新闻、广告和报告的评估与判断。本书最后一部

    分指明我们判断事物真假的能力必须建立在科学方法的基础上。人们用

    科学方法探索奥秘,它是人类历史上最重要的工具。科学方法的起源,可以追溯至人类历史上一些最伟大的思想家,比如亚里士多德、培根、伽利略、笛卡儿、塞姆尔维斯和波普尔。这部分还探索了关于人类已经

    熟知的、未来有能力掌握的、目前未知的,以及更加神秘莫测的信息领

    域。为此我提供了大量的案例,以证明逻辑思维可以应用于各种各样的

    背景,比如法庭证词、医疗决策、魔术、现代物理学和阴谋论等。

    我们用批判性思维思考问题,并不意味着贬低一切事物,而意味着

    区分有证据支持的观点和空口无凭的论断。

    对于某些政党成员来说,用统计数据和图表来编造谎言轻而易举。

    他们知道,大多数人认为深入了解他们的工作需要花费大量时间,这些

    人甚至还会认为自己不够聪明,但事实上任何人都可以做到这一点,一

    12

    旦遵循一些基本的原则,图表就会迅速显示出它们的精确简练或缺陷。

    以前文的数据作为例子,在小学二年级之后,学生平均阅读图书的

    数量一直在减少。言下之意是,我们的教育体系存在缺陷,孩子没有从

    小养成良好的阅读习惯,对提升自身素质并不感兴趣,也没有付诸行

    动。现在让我们停下来,提一个问题:上述论述中,图书的数量是得出

    结论的可靠标准吗?通常,二年级的学生阅读的图书不厚,随着年龄的

    增长,图书的页数会逐渐增加。到了中学,孩子们可能会阅读《蝇王》

    (200页),而大学时期,便能够阅读长达1225页的《战争与和平》

    了。此时,也许我们应该关注阅读的页数或者阅读需要花费的时间。通

    过学习研究生课程,或者从事许多专业领域的工作,如法律、政府、工

    业、金融和科学等,人们阅读的书籍也许会越来越少,但是文章的质量

    却会越来越严谨,学术性质也越来越浓厚。如果一名公务员从没阅读过

    任何图书,但会阅读一些法律、章程、情报简报、报纸和杂志等,你会

    说他没有在阅读上付出吗?引用的一项统计数据,并不一定和当前的问

    题存在关联。此外,这项研究可能是由一家设计和销售提高阅读能力的

    软件公司开启的,因此它倾向以一份显示人们的阅读水平较低的报告作

    为证据。显然,我们需要运用批判性思维来分析这个问题。

    认识到故事中可能有错误的论点,你才能够做出一连串推理判断,最终得出结论。信息素养意味着能够认识到信息源的质量存在一定的层

    次结构,伪事实很容易掩饰事实,而偏见会曲解我们需要分析的信息,导致我们做出错误决定,造成负面影响。

    有时,证据是由数字组成的,我们就会提出疑问:“这些数字源于

    何处?要怎样收集?”有时,一些数字是荒谬的,需要我们深思熟虑才

    能够有所察觉。有时,一些言论看上去是合理的,但是其来源却缺乏可

    信度,比如一个声称自己目击现场犯罪的人,其实当时并不在场。很多

    事情的真实情况和其表象都会有所出入,而本书正好能够教会你进行分

    辨,并及时阻止说谎者的脚步,还世界以更多真相。[8]

    13

    [1] every single year after second grade http:www.yalsa.ala.org thehub20120416so-how-

    much-are-kids-really-reading.

    [2] more than one in five adult Americans were not even able to locate information

    http:nces.ed.govpubs9393275.pdf.

    [3] there are 45,790 reporters and correspondents https:www.bls.govoes currentoes_nat.htm.

    [4] for the nearly 1,400 daily newspapers in the United States http:asne.orgcontent.asp?

    contentid=415.

    [5] “making it easier for its 1.8 billion members to report fake news”

    http:www.nytimes.com20161215technologyfacebook-fake-news.html.

    [6] thriving community of “fake news” fabricators http:www.nbcnews.com newsworldfake-

    news-how-parying-macedonian-teen-earns-thousands -publishing-lies-n692451.

    [7] Misinformation has been a fixture of human life Abraham provides mis- information about the

    identity of his wife, Sarah, to King Abimelech to protect himself. The Trojan horse was a kind of

    misinformation, appearing as a gift but containing soldiers.

    [8] avoid learning a whole lot of things that aren’t so After Huff, D. (19541993). How to Lie with

    Statistics. New York: W.W. Norton, p. 19. And, as you’ll read later, he probably was echoing Mark

    Twain, or Josh Billings, or Will Rogers, or who knows who.

    14

    第一部分

    变幻莫测的数字

    陷我们于困境的并非自己的无知,而是确信无疑之事其实不

    然。

    ——马克·吐温

    15

    第1章

    数字的合理性

    由于统计数据本身是数字,所以于我们而言,它们似乎代表了冷冰

    冰的、铁一般的事实。然而,切勿忘记这一点:统计数据由人们收集而

    来。统计的对象、方法、结果和文字说明皆由参与统计过程的人进行甄

    选和采用。[1]

    因此,数字并非事实,它们仅仅是对事实的一种诠释。而

    且,这种诠释还会因人而异。

    有时候,数字本身就是错的。此时,最便捷的处理方法是快速检查

    数字的合理性。然而,即便通过了合理性测试,数字的收集方法、解读

    方法和图示方法方面的错误,也会让你对事物产生错误的认知。

    很多时候,要快速评判某种表述是否合理,只需对相关数字进行思

    考或粗略计算。切勿轻信盲从,一定要多加思考。

    当评估一个表述的合理性时,我们并不在意相关数字的准确性。这

    种做法看似有悖常理,但数字的准确性在此处确实无关宏旨。我们根据

    常识即可对很多类似下面的表述做出判断:如果伯特称,一只水晶酒杯

    从桌上落下,砸到厚厚的地毯却没碎,这听起来似乎合理;而如果欧尼

    说,该酒杯从40层大楼的楼顶落到水泥地面,依然完好如初,则必定不

    合理。我们判断的依据来自生活常识和日常经验。同理,假如有人自称

    200岁,或始终能在拉斯韦加斯轮盘赌局中获胜,又或跑步速度可达40

    英里[2]

    小时,这些就纯属无稽之谈了。

    我们试举一例。怎样评估以下表述?

    在加利福尼亚州解除大麻禁令的35年间,吸食大麻的人数每年

    16

    都会增加一倍。

    合理吗?从何处入手判断?我们假设35年前加利福尼亚州只有1人

    吸食大麻。当然,这个数字非常保守(要知道,1982年美国全境逮捕了

    50万名吸食大麻者)。如果按35年间每年翻一倍计算,所得结果会从最

    初的1人变为170亿人,远远高于全世界的总人口(试算一下,你就会发

    现,按照该算法,实际上21年后吸食大麻的人数就已超过100万:1,2,4,8,16,32,64,128,256,512,1024,2048,4096,8192,16384,32768,65536,131072,262144,524288,1048576)。因此,该表述不但不合理,而且不可能成立。然而,很多人由于惧怕数字,所

    以都算不出来,十分遗憾。其实,如此例所示,只需运用小学数学知识

    和合理假设即可算出准确结果。

    我们再举一例。假设你刚当上电话推销员,负责向没有戒心的潜在

    客户推销。因为这个行为极有可能惹恼客户,所以老板要激励心存担忧

    的你,他宣称:

    我们最好的推销员每天都能完成1000个销售额。

    该表述合理吗?你自己试着拨打一个电话号码,完成拨号最快也需

    要5秒钟,等对方的电话铃响起又需5秒。假设每接通一个电话,你都能

    完成一个销售额。虽然现实中未必如此,但我们确保最理想的假设条

    件。你完成推销说辞并说服对方需要10秒,拿到其信用卡号和通信地址

    又需要40秒。这样,完成一次通话,需要一分钟(5 + 5 + 10 + 40 = 60

    秒)。那么,一个小时内你能完成60个销售额。也就是说,即使马不停

    蹄地工作,一个工作日一个人最多也只能完成480个销售额。因此,即

    使在理想状况下,每天完成1000个销售额的说法也不合理。

    有一些表述的评估难度更大。请看下面这条摘自2013年《时代周

    17

    刊》的新闻标题:

    使用手机的人比用马桶的人还多。[3]

    怎样分析呢?我们可以思考一下发展中国家缺乏管道设施的人数,以及发达国家的多数民众不只拥有一部手机这样的观察经验。不能因为

    该标题看似合理,我们就不假思索地欣然接受它。我们只不过无法立即

    判定它为荒唐可笑的表述而已。要评估这个表述,还需借助其他手段,但这无疑已超出分析合理性的范畴。

    如果不亲自做一点研究,评估表述有时就会比较吃力。的确,报纸

    和网站理应为你完成这项工作。然而,它们难免会百密一疏。于是,一

    些统计数据便如同“脱缰之马”一般乘虚而入,并站稳脚跟。几年前,媒

    体曾对下面的这项统计数据进行了大肆报道:

    美国每年都有150000名女孩和年轻妇女死于厌食症。[4]

    为了检查其合理性,我们必须做一些深入思考。按照美国疾病控制

    与预防中心的说法,每年由各种原因导致的、年龄在15~24岁的女孩和

    年轻妇女的死亡人数约为8500人。如果再加上每年25~44岁年龄段妇女

    的死亡人数,总人数也只不过为55000人。[5]

    所以,一年内死于厌食症

    的人数绝不可能达到死亡总人数的3倍。[6]

    在一篇发表于《科学》杂志的文章中,路易斯·波拉克(Louis

    Pollack)和汉斯·韦斯(Hans Weiss)宣称,自通信卫星公司成立以来,打一次电话的费用降低了12000%。[7]

    18

    如果某一项费用降低了100%,那么它必然为零(不论最初的数字

    是多少)。如果费用降低200%,对方就要支付给你与他们的某个产品

    或服务的售价相等的金额。费用降低100%的现象是不可能的,降低

    12000%更是无稽之谈。[8]

    发表于同行评审的《管理学发展期刊》

    (Journal of Management Development)上的一篇文章则宣称,在实施了

    一项新的顾客关心战略之后,顾客投诉数量减少了200%。[9]

    更有甚者,丹·凯珀尔(Dan Keppel)竟然以《物有所值:在股票、共同基金和每种金融需求方面节省200%的资金》(Get What You Pay

    For: Save 200% on Stocks, Mutual Funds, Every Financial Need)作为其书

    名。他拥有工商管理学硕士头衔,理应处理得更好才是。

    当然,在使用百分率时一定要采用同样的基数,只有这样才能保证

    计算结果有可比性。现有薪水降低50%后,在这个新的、更低的薪资额

    基础上增加50%的做法,绝对不能把你损失的一半薪水全部弥补回来。

    其原因在于,百分率的基数已经发生变化。假如你的周薪为1000美元,薪水降低50%后,你的周薪变为500美元。在此基础上把周薪再增加

    50%,你的周薪也只不过变为750美元。

    虽然百分率看似简单、可靠,但是却常常令人感到困惑。如果银行

    利率由3%上浮至4%,即增长了1个百分点或33%(因为1%的增长以3为

    19

    基数,所以13≈0.33)。而如果利率从4%下降到3%,相当于降低了1个

    百分点,但却不是降低了33%,而是降低了25%(此时,1个百分点的下

    降以4为基数)。研究人员和媒体记者不能永远做到谨慎区分百分点和

    百分率,但是本书的读者理应做到。[10]

    《纽约时报》曾报道了一家位于康涅狄格州的纺织厂由于用工成本

    高而关停,并且搬到了弗吉尼亚州。[11]

    该报称,康涅狄格州的用工成

    本“包括工资、补助和失业保险——比弗吉尼亚州高20倍”。该报道合理

    吗?假设其合理,那么你就会想到:应该有大量的公司会从康涅狄格州

    搬到弗吉尼亚州——而不是只有这一家纺织厂。果真如此的话,那么现

    在你也理应听到相关的消息了。实际上,上述报道并非实情。为此,《纽约时报》不得不做出更正声明。那么,这种错误的报道是怎样出现

    的呢?当时,负责此次新闻报道的记者没有理解该工厂的一份内部报

    告。实际上,康涅狄格州的用工成本中只有一项,即失业保险是弗吉尼

    亚州的20倍。当我们把这项成本与其他成本计算在一起时,康涅狄格州

    的总失业成本其实只高出了1.3倍,而并非20倍。这位记者从未接受过

    企业管理方面的专业培训,所以情有可原,我们不必苛责于她。要找出

    此类错误,就要求我们迂回一步,进行独立思考。这一点任何人都可以

    做到(那位新闻记者和负责的编辑当时应当做到这一点)。

    新泽西州正式通过了一项立法,规定已育有子女的母亲在领取社会

    福利的同时,不能再领取额外补助。[12]

    一些立法人员认为,新泽西州

    的妇女生孩子只是为了增加个人每月的福利金额。立法实施两个月后,立法者宣称,由于新生儿数量下降了16%,“家庭福利封顶”法(“family

    cap” law)大获成功。《纽约时报》报道称:

    新法实施两个月后,该州公布的统计数字表明,领取社会福利

    的妇女所生的新生儿人数下降了16%。[13]相关立法官员开始庆祝该

    项立法迅速见效。

    20

    请注意,他们统计的不是妊娠数量而是新生儿人数。这就会出现什

    么问题呢?要知道,妊娠期一般约为9个月,所以立法实施后,前两个

    月内新生儿数量的下降不能简单归因于立法本身,其原因极有可能是出

    生率正常的周期性波动(出生率的变化具有周期性)。

    即便如此,上述报道还存在一些依靠合理性检查发现不了的问题:……一段时间以后,16%的下降幅度逐渐减小为10%左右。直到

    此时,州政府才开始慢慢意识到,出生报告存在漏报的情况。原

    来,很多新生儿的母亲认为,既然自己的社会福利不会增加,那么

    就没有必要将刚出生的孩子上报了。[14]

    上面的例子说明了统计数字收集方法存在的问题——我们自认为统

    计调查覆盖了所有的统计对象,实际上并非如此。有时,一些推理错误

    往往更难被发现。但是,通过练习,我们可以提升自己的判断力。下

    面,我们先来了解一种经常被误用的统计学基础工具。

    饼状图是一种可以直观地表示百分率的简易工具。它可以显示整体

    中不同部分的分布情况。或许,你想知道一个学区在诸如教职工工资、教学材料和设施维护方面的预算支出的百分比情况。又或许,你想了解

    一下教学材料预算资金在算术、科学、语言艺术、体育、音乐等学科上

    分配的百分比情况。饼状图的基本使用规则是各百分比的总和必须等于

    100%。试想有一个大圆饼,假如有9个人都想要其中的一个等份,那么

    你就不能把圆饼切成8份,而只需把圆饼按人数等份切割即可。尽管饼

    状图的使用规则如此简单,但却不能阻止福克斯新闻(Fox News)发布

    下面这样的饼状图:

    21

    饼状图使用第一规则:各百分比总和必须为100%

    (2010年,福克斯新闻)

    你可以想象一下这种情况是如何产生的。由于选民可以选择投票支

    持一个以上的总统候选人,所以不应该用饼状图来表示选举结果。

    [1] This sentence is nearly a direct quote from Best, J. (2005). Lies, calculations and constructions:

    Beyond How to Lie with Statistics. Statistical Science, 20(3), 210–214.

    [2] 1英里≈1609米。

    [3] Wang, Y. (2013, March 25).More people have cell phones than toilets, U.N. study shows.

    http:newsfeed.time.com20130325more-people-have-cell-phones-than-toilets-u-n-study-shows.

    [4] Steinem, G.(1992). Revolution from Within. New York: Little, Brown and Company.Wolf, N.

    (1991). The Beauty Myth. New York: William Morrow.

    [5] This example came to my attention from Best, J. (2005). Lies, calculations and constructions:

    Beyond How to Lie with Statistics. Statistical Science, 20(3), 210–14. The statistics are available at

    www.cdc.gov.

    22

    [6] Maybe you’ re in the accounts payable department of a big corporation. An employee put in

    for reimbursement of gasoline for the business use of his car, 5,000 for the month of April. Start with

    a little world knowledge: Most cars get better than twenty miles per gallon these days (some get several

    times that). You also know that the fastest you can reasonably drive is seventy miles per hour, and that

    if you were to drive ten hours a day, all on the freeway, that would mean 700 miles a day. Keep that up

    for a standard 21.5-day work month and you’ ve got 15,050 miles. In these kinds of rough estimates, it’

    s standard to use round numbers to make things easier, so let’ s call that 15,000. Divide that by the fuel

    economy of 20 mpg and, by a rough estimate, your employee needed 750 gallons of gas. You look up

    the average national gas price for April and find that it’ s 2.89. Let’ s just call that 3.00 (again,rounding, and giving your employee the benefit of the doubt — he may not have managed to get the

    very best price every time he filled up). 3gallon times 750 gallons = 2,250. The 5,000 on the

    expense report doesn’ t look even remotely plausible now. Even if your employee drove twenty hours a

    day, the cost wouldn’ t be that high. https:www.fueleconomy.govfegbestbestworstNF.shtml

    retrieved August 1, 2015. e.g. http:www.fuelgaugereport.com.

    [7] Pollack, L. Weiss, H. (1984). Communication satellites: countdown for Intelsat VI. Science,223(4636), 553.

    [8] I suppose you could spin a story that makes this true. Maybe a widget used to cost 1, and

    now, as part of a big promotion, a company is not just willing to give it to you for free, but to pay you

    11,999 to take it (that’ s a 12,000 percent reduction). This happens in real estate and big business.

    Maybe an old run-down house needs to be razed before a new one can be built; the owner may be

    paying huge property taxes, the cost of tearing down the house is high, and so the owner is willing to

    pay someone to take it off of his or her hands. At one point in the late 1990s, several large, debt-ridden

    record companies were “selling” for 0, provided the new owner would assume their debt.

    [9] Bailey, C., Clarke, M. (2008). Aligning business leadership development with business

    needs: the value of discrimination. Journal of Management Development, 27(9), 912–934. Other

    examples of a 200 percent reduction: Rajashekar, B. S., Kalappa, V. P. (2006). Effects of planting

    seasons on seed yield quality of tomato varieties resistant to leaf curl virus. Seed Research, 34(2),223–225. http:www.bostoncio.comAboutRichardCohen.asp.

    [10] Illustration . 2016 by Dan Piraro based on an example from Huff, ibid.

    [11] I’m grateful to James P. Scanlan, attorney-at-law, Washington, D.C., who answered my query

    to the membership of the American Statistical Association, and provided me with this misuse.

    [12] This example comes from Spirer, L., Spirer, H. Jaffe, A. J. (1987). Misused Statistics, p.

    194. New York: Marcel Dekker. Miller, J. (1996, Dec. 29). High costs are blamed for the loss of a mill.

    New York Times, Connecticut Section. and n. a. (1997, Jan. 12) Correction, New York Times,Connecticut Section.

    [13] McLaren, K. J. (1993). New Jersey Welfare’ s Give and Take; Mothers Get College Aid, but

    23

    No Extra Cash for Newborns. New York Times. See also: Henneberger, M. (1995 April 11 ). Rethinking

    Welfare: Deterring New Births — A special report; State Aid Is Capped, but to What Effect? New York

    Times.

    [14] Ibid.

    24

    第2章

    平均数的妙用

    平均数是一种非常有用的概括统计量,甚至比饼状图还易于理解。

    有了平均数,我们就可以用单一数字来描述大量的信息。比如,我们可

    能需要知道一间屋子里的全体人员所拥有的平均财富,以便让资金募集

    者或销售经理确定是否有必要与他们会面。又比如,我们也许需要了解

    汽油的平均价格,才能估算从温哥华驾车到班夫的交通成本。然而,平

    均数有时也具有一定的迷惑性和复杂性。

    计算平均数的方法有三种,其计算结果往往各不相同。因此,具备

    统计学敏锐感的人们通常都会避免笼统地使用“平均数”一词,而代之以

    算术平均数、中位数和众数这些更为准确的术语。我们不说“中间平均

    数”“居中平均数”,或干脆简称为“平均数”,我们一般称其为算术平均

    数、中位数和众数。有时候,这三种平均数的数值相等,但多数情况下

    却并不相同。如果你只看到“平均数”一词,一般情况下它指的是算术平

    均数,但你也不能就此肯定。

    上述三种平均数中,算术平均数最常见。把全部观测或报告数值相

    加,再除以相应数字的个数,即可得到算术平均数。例如,对于身处同

    一间屋子里的所有人来说,他们拥有财富的平均数就等于总财富除以总

    人数。假如屋子里有10个人,每个人有10万美元,那么总财富就是100

    万美元。无须使用计算器,你就能计算出所有人的财富算术平均数为10

    万美元。再假如,另一间屋子里同样有10个人,每个人有5万~15万美

    元,但总财富也是100万美元,那么此房间里所有人的财富算术平均数

    仍然为10万美元(原因在于,我们采用的计算方法都是用总财富100万

    美元除以总人数10,而不考虑具体每个人的财富)。

    25

    中位数指的是位于一组数字(统计学家称其为一个分布)中间的那

    个数字:整组数字中有一半数字大于该数字,而另一半数字则比它小。

    上文提到,平均数可以用单一数字来描述大量的信息。在你的统计观测

    值中,当一些观测值与绝大多数观测值之间存在巨大差异时,中位数就

    可以很好地起到这种作用。统计学家称其为极端值。

    如果我们拜访的屋子里面有9个人,假设其中8个人都有10万美元左

    右,而且只有1人由于负债而濒临破产,此人有50万美元的债务,那

    么,这个屋子里9个人的财富情况为:

    第一个人:–500000美元

    第二个人:96000美元

    第三个人:97000美元

    第四个人:99000美元

    第五个人:100000美元

    第六个人:101000美元

    第七个人:101000美元

    第八个人:101000美元

    第九个人:104000美元

    现在,我们把上述数字相加,所得结果为299000美元;再除以统计

    观测值的总个数9,得到的算术平均数为33222美元。但是算术平均数似

    乎并没有起到描述屋子里9个人的财富特征的作用。从所得的算术平均

    数来看,你的资金募集者或许会认为已经没有必要与这些人会面。把财

    富平均数拉低的其实只有1人,即有1个极端值。这就是算术平均数本身

    存在的问题:它对极端值敏感。

    26

    上述一组数字的中位数应为100000美元:有4人的净财富值小于

    它,另外4人的净财富值则大于它。该组数字的众数为101000美元,它

    在整组数字中出现的次数最多。在这个特殊的例子当中,中位数和众数

    的作用要比算术平均数更大。

    利用各种平均数来操控数据,从而实现个人的某种目的,其方法有

    很多种。

    现在我们假设:你和两位朋友一起创办了一家公司,有5名员工。

    时值岁末,你准备向全体员工通报公司的财务状况。因为这样做,一则

    能使废寝忘食、辛劳一年的员工感到欣慰;二则还可以为公司吸引投资

    方。假设4名员工(均为程序员),每人的年薪为70000美元,另外1名

    员工(接待人员办公室经理)的年薪为50000美元。那么,公司所有员

    工全年工资的算术平均数为66000美元[(4×70000+1×50000)5]。你

    和其他两名合伙人,每人的年薪按照100000美元计算。据此,可计算出

    公司的年度工资成本为:4×70000+1×50000+3×100000=630000美元。再

    假设公司该年度的利润为210000美元,你把这部分钱作为奖金与其他合

    伙人平均分配。那么,公司三位创始人每人每年可得到170000美元

    (100000+70000)。如何针对这些情况写年度财务报告呢?

    你可以这样汇报:

    员工平均薪水:66000美元

    公司创始人平均薪水+平均所得奖金:170000美元

    虽然这样的财务报告很真实,但极有可能除了你和你的母亲之外,其他人都不会感到满意。如果员工风闻此事,他们可能会觉得公司亏欠

    自己,而潜在的投资方则会认为公司创始人得到的回报过多。因此,你

    还可以这样汇报:

    27

    员工平均薪水:66000美元

    公司创始人平均薪水:100000美元

    利润:210000美元

    这样的报告会让潜在的投资方更满意。对于你已经把利润在创始人

    之间进行分配一事,大可略去不提。在向员工做通报时,你也可以省略

    最后一项有关公司利润的内容。4名程序员都会觉得公司看重他们的价

    值,因为他们的年薪高于员工平均薪水水平。那位负责接待事宜的办公

    室经理则不会心满意足,毫无疑问,她知道程序员的薪水肯定比自己

    高。

    现在我们再假设:你认为公司人手紧缺,想要招聘新员工。你想就

    此说服那两位对批判性思考知之甚少的合伙人。就像很多公司的做法一

    样,你可以把210000美元的利润在5名员工之间进行分配,从而做出关

    于“员工人均年度创造的利润”的年度财务报告:

    员工平均薪水:66000美元

    公司创始人平均薪水:100000美元

    员工人均年度创造的利润:42000美元

    此时,你便可以宣称,公司支付给员工薪水的64%(4200066000)

    最终都会以利润的形式收回。这意味着,在收回全部年度利润后,公司

    真正用于支付员工薪水的部分只有全部员工年度总工资的36%。当然,这些数字并不能说明增加员工人数可以提高公司的利润额。公司的利润

    额也有可能与员工人数毫不相干。但是,对于不会进行批判性思考的人

    来说,这个年度财务报告足以作为你提议增加员工人数的理由。

    我们再来看一种假设情形。假如你想要宣称:作为一名管理者,你

    28

    对待员工非常公平、公正,并且实际上创始人获得的利润和员工的薪水

    非常合情合理。那么,怎样做年度财务报告呢?你可以拿出210000美元

    的利润,将其中的150000美元作为自己和其他合伙人的工资或奖金,而

    把剩余的60000美元报告为“利润”。这一次,在计算公司平均薪水时,要把你和另外两位合伙人的工资和奖金包括在内。

    公司平均薪水:97500美元

    公司创始人平均利润:20000美元

    下面的报告则更有趣:

    工资总成本+奖金:840000美元

    总薪水:780000美元

    公司利润:60000美元

    这个报告看上去就非常合理了,是吧?整家公司可用于支付员工薪

    水的资金加上利润总共为840000美元,其中公司所有者拿走的经营利润

    只有60000美元(7%)。你的员工肯定认为你无可指责——谁会对只拿

    走利润7%的创始人心存怨言呢?其实,一个创始人拿走的利润远没有

    这么多——7%的利润还要在三名公司创始人之间平均分配,每人只能

    得到2.3%的利润。这根本不值得抱怨!

    你的年度财务报告甚至可以做得更出色。假如在开始经营的第一

    年,公司只有兼职员工,他们每年可为公司创造40000美元的利润。第

    二年,公司只有全职员工,所创造的利润为上面提到的66000美元。此

    时,你就可以如实宣告:公司员工创造的年度平均利润上涨了65%。这

    显示出你是多么出色的一位管理者!不过,此处,你在报告中掩盖了对

    比兼职员工和全职员工的事实。这种做法并非你的首创:早在20世纪40

    29

    年代,美国钢铁公司就使用过这种方法。

    在刑事审判中,信息的呈现方式——统计所取的抽样单位——深刻

    地影响着陪审员对嫌疑人有罪与否的最终判决。请看这样两条证词:

    (1)“如果从犯罪现场采集的血滴不是来自犯罪嫌疑人,那么后者的血

    型与其相匹配的可能性只有0.1%”(千分之一);(2)“休斯敦市有千

    分之一的人血型与犯罪现场的血滴相匹配”。尽管这两条证词在数学意

    义上完全等价,但比较一下,第一条证词远比第二条证词更有说服

    力。[1]

    平均数常用于表达诸如“每X个婚姻中就有1个以离婚收场”之类的统

    计结果,但这并不意味着这样的统计结果就一定适用于你所在的街区、桥牌俱乐部或你认识的人。它可能适用,也可能不适用——因为它表达

    的只是全国范围内的一种平均情况,还可能存在某些干扰因素,它们在

    预测谁将会离婚、谁不会离婚中也起着一定作用。

    与此类似,也许你曾读到过这样的报道:每5个新生儿当中就有1个

    是中国婴儿。你注意到,街上的那个瑞典家庭已经有了4个孩子,而且

    现在母亲腹中正怀着1个孩子。不过,这并不意味着这位瑞典母亲即将

    生出一个中国婴儿——“每5个新生儿当中就有1个是中国婴儿”的说法指

    的是全世界范围内新生儿的一种平均情况,并非限定于某个特定家庭或

    街区,甚至特定国家的出生情况。

    对于各种平均数及其使用方法,我们一定要多加小心。它们在迷惑

    我们时所采用的一种方法是:把从完全不同的总体中抽取的样本综合在

    一起。采用这种方法,就会得出类似下面这样荒谬的论述:

    平均来说,人类的睾丸数量为1个。[2]

    这个例子说明了算术平均数、中位数和众数之间的差别。由于世界

    30

    上女人的总人数略多于男人的总人数,所以中位数和众数均为0,而算

    术平均数接近于1(为0.98左右)。

    另外,还有一点也需要小心对待并铭记于心:平均数并不能说明整

    组数字的范围。加利福尼亚州死亡谷年平均气温为77华氏度(25摄氏

    度),令人感觉非常舒适。但是,该地区气温的变化范围却可能要了人

    命。因为有记录显示,死亡谷的气温范围在15华氏度(–9.44摄氏度)

    至134华氏度(56.67摄氏度)。[3]

    再举一例:在一间有100个人的屋子里,所有人的财富平均数非常

    巨大,达到3.5亿美元。你很有可能认为,这里就是你要派100名最优秀

    的销售人员去的地方。但是,这间屋子里的100个人可能是由马克·扎克

    伯格(Mark Zuckerberg,拥有350亿美元净资产)和99名穷人组成。平

    均数往往会抹去一些重要的差异。

    在面对平均数时,我们还要对双峰分布保持警惕。我们知道,众数

    是一个数组中出现频率最高的数字。在生物学、物理学和社会学的很多

    数据集当中,数字的分布往往会呈现两个或多个峰——也就是,两个或

    多个数字出现的频率高于其他数字。

    31

    例如,类似上面的图,它表示的可能是一周内的午餐费用支出(x

    轴)和用餐人数(y轴)。[4]

    假设在你的统计调查中存在不同的两组

    人:儿童(左峰——他们在学校购买午餐)和企业主管(右峰——他们

    在豪华餐厅就餐)。这里的算术平均数和中位数可能恰好是位于两个峰

    值之间的某个数字,所以它们说明不了多少实质问题。事实上,在很多

    情况下,没有人的午餐费用数字会是算术平均数和中位数所代表的数

    字。这样的图往往表明,你的样本存在异质性,或者说你所比较的是两

    种没有可比性的事物。此处,在报告中指出这属于双峰式分布,并且分

    别给出两个众数,这才是更妥当的做法。把上述不同的两组人分开,并

    分别统计,才是最佳的处理方式。

    不过,当根据平均数得出个人和群组的统计学结论时,一定要提高

    警惕。鉴于在这方面常常会犯相同的错误,人们对这些错误进行了命

    名:生态学谬误和例外谬误。当我们依据综合数据(如群组的算术平均

    32

    数)推断个体情况时,便会出现生态学谬误;而当我们根据少数例外的

    个体数据推断整个群组的情况时,则会出现例外谬误。

    例如,我们假设有两个小城镇A和B,每个城镇的居民人口均为100

    人。城镇A中有99人每人每年可赚到80000美元,剩下的1人是在自家土

    地上从事石油钻探的一名超级女富豪,她每年的收入高达5000000美

    元。城镇B中有50人每人每年可赚到100000美元,另外50人每人每年的

    收入为140000美元。城镇A居民年收入的算术平均数为129200美元,城

    镇B居民年收入的算术平均数为120000美元。尽管城镇A居民年收入的

    算术平均数较高,但如果分别从两个城镇中随机选择一人来比较其年收

    入,那么来自城镇B的人收入高于城镇A的人的概率为99%。从算术平

    均数较高的群组中随机选择某人,其年收入很可能也较高,这种看法就

    属于生态学谬误。

    再比如,有种观点认为,富裕的选民更有可能把选票投给共和党,但证据表明较富裕的州往往倾向于投票支持民主党。在这些较富裕的州

    里,人口数量百分比较小的超级富豪可能使得整个州的财富数字发生了

    偏离。2004年美国总统大选期间,共和党候选人乔治·W. 布什在较贫穷

    的15个州获胜,而在较富裕的11个州中,有9个州选择了支持民主党候

    选人约翰·克里。[5]

    然而,62%的年收入超过200000美元的选民选择投

    票给布什,而只有36%的年收入不超过150000美元的选民把选票投给了

    布什。

    下面我们举一个例外谬误方面的例子。你可能了解到,沃尔沃汽车

    属于性能最可靠的汽车品牌之一。所以,你下定决心购买一辆沃尔沃汽

    车。你去该品牌4S店的途中,恰好从一个沃尔沃修理厂旁边经过。此

    时,你发现停车场上停满了待修理的沃尔沃汽车。如果你据此改变购买

    沃尔沃汽车的决定,那么你的所作所为就是在使用数量相对较小的例外

    情况来推断群组的整体情况。从没有人说过沃尔沃汽车不需要修理,只

    不过整体而言,这个品牌的汽车出现故障的可能性较小而已(沃尔沃公

    33

    司有一条提示性的广告语——“具体情况可能会有不同”。这条广告语之

    所以随处可见,原因即在于此)。同时也要注意,例外谬误在此处还以

    这样一种方式使你受到了过多的影响:沃尔沃汽车只能在沃尔沃专属修

    理厂修理。由于你的“基准率”已经发生了转移,所以不会将其视为随机

    样本。

    既然此时你也算是平均数方面的专家了,那么下面这个非常著名的

    错误认识不应该出现在你身上,即认为生活在100年前的人的寿命不如

    现代社会的人的寿命长。或许你已经了解到,现代社会人们的预期寿命

    一直在平稳地提高。对于出生在1850年的人来说,男女的预期寿命分别

    为38岁和40岁;而对于出生在1990年的人来说,男女的预期寿命分别为

    72岁和79岁。[6]

    所以有一种观点据此认为,与20世纪相比,19世纪时五

    六十岁的人并不多见,其原因就在于生活在19世纪的人的预期寿命更

    短。但实际上,19世纪的人确实活到了同样的岁数——只不过当时婴儿

    和儿童的死亡率很高,因此拉低了人们的整体预期寿命。在那个时代,如果一个人活过了20岁,那么他的寿命也可能很长。的确,在1850年,一位50岁的白人妇女有望活到73.5岁,60岁的白人妇女则可能活到77

    岁。现代社会五六十岁的人的预期寿命确实提高了,与1850年相比,预

    期寿命提高了10年左右。这主要应归功于更好的医疗卫生条件。在上文

    中,我们曾列举了整间屋子都是收入差别很大的人的一个例子。与该例

    相同,过去的175年里人们出生时平均预期寿命的各种平均数的变化,反映了两个统计样本之间存在的巨大差异:相对而言,19世纪时的婴儿

    死亡率更高,所以拉低了人们的预期寿命。

    请看一个脑筋急转弯:为什么一个家庭拥有的孩子的平均数量并不

    等于家庭总数的平均数?[7]

    因为统计基准发生了转移[我在此处使用

    了“平均”一词而未使用“算术平均数”,完全是出于对詹姆斯·詹金斯

    (James Jenkins)和特雷尔·图滕(Terrell Tuten)二人的尊重,他们共

    同写了一篇探讨同一主题的论文,并且论文的标题使用的就是“平均”一

    词]。

    34

    现在,我们假设你读到了这样一条信息:在一个位于市郊的社区

    里,每个家庭平均有3个孩子。那么,你也许会得出结论说,每个孩子

    平均都有两个兄弟姐妹。但是,这种结论并不正确。当我们提出下述问

    题时,也会犯与此相同的逻辑错误:每位大学生上的是不是规模平均的

    大学;每位员工挣的是不是平均工资;或者每棵树木是否平均取自每片

    森林。

    上面所举的所有例子都与统计的基准或我们所研究的样本群组的转

    移有关。当计算每个家庭的平均孩子数量时,我们的统计样本以家庭为

    单位。成员很多的家庭和成员很少的家庭当然各自只能算作一个家庭。

    而当我们计算孩子拥有的兄弟姐妹的平均数(算术平均数)时,我们的

    统计样本则以孩子为单位。在成员数量很多的家庭里,每个孩子都要计

    算一次,所以每个家庭中孩子拥有的兄弟姐妹的数量对于孩子兄弟姐妹

    的平均数来说,显得非常重要。简而言之,一个有10个孩子的家庭,在

    关于家庭平均孩子数量的统计中只计算一次,但在孩子的平均兄弟姐妹

    数量统计中则要计算10次。

    假设在这个假想的社区里,有一条街道上居住着30个家庭。其中,4个家庭没有孩子,6个家庭各有1个孩子,9个家庭各有2个孩子,11个

    家庭各有6个孩子。那么,每个家庭平均拥有3个孩子,因为90(孩子总

    数)除以30(家庭总数)即为3。

    我们再来看每个孩子拥有的兄弟姐妹的平均数情况。[8]

    人们所犯的

    错误在于,他们认为假如每个家庭平均拥有3个孩子,那么每个孩子必

    定平均拥有两个兄弟姐妹。但是,在上述拥有1个孩子的家庭当中,6个

    孩子都没有兄弟姐妹。在拥有两个孩子的家庭当中,18个孩子平均都有

    1个兄弟姐妹。在拥有6个孩子的家庭当中,66个孩子平均都有5个兄弟

    姐妹。对于全部90个孩子来说,他们的兄弟姐妹总数为348个。因此,尽管平均来说,每个孩子都来自平均拥有3个孩子的家庭,但是却有348

    个兄弟姐妹可以在全部90个孩子中间进行平均分配,或者说,每个孩子

    35

    平均拥有的兄弟姐妹数量约为4个。

    注:平均每个家庭的孩子数量:3.0。

    平均每个孩子的兄弟姐妹数量:3.9。

    现在,我们再来思考有关大学规模的问题。美国有很多规模较大的

    大学(比如俄亥俄州立大学和亚利桑那州立大学),这些大学的在校学

    生人数均超过了50000人。在校学生人数在3000人以下的规模较小的大

    学(比如肯扬学院和威廉姆斯学院)也为数众多。如果以学院为统计单

    位,我们会发现,平均规模学院的在校学生人数为10000人。而如果以

    学生为统计单位,我们将会看到,平均来说,每位学生所上的大学都是

    在校学生人数超过30000人的大学。之所以出现这样的结果,其原因在

    于,当统计学生时,我们从规模较大的学校那里得到了多得多的数据

    量。类似地,人们并不都分散着住在城市里,平均水平的高尔夫玩家打

    的也不是平均的回合(总击球数为18洞)。

    36

    37

    以上这些例子都涉及了统计基准或分母的转移。在上文中讨论儿童

    的死亡率时,我们就曾触及了偏态分布。我们再看一个这方面的例子:

    平均来说,每个投资人赚取不到平均回报。[9]

    在一项研究中,投资100

    美元,投资期为30年,最终的回报为760美元,或者说每年的回报率为

    7%。但实际情况表明,不但有9%的投资人的投资受损,而且高达69%

    的投资人最终都没能得到平均回报额。这是因为,投资所得超过平均投

    资回报额的少数投资人使得平均回报发生了偏离。在下面这张图中,那

    些幸运的投资人大赚了一笔,他们把算术平均数拉向了右边。

    一项投资额为100美元、投资期为30年的投资回报结果。请注意,大多数投资人的回报小于投资

    回报的算术平均数,而少数一些幸运的投资人所得到的投资回报超过了投资回报算术平均数的5

    倍。

    [1] Koehler, J. J. (2001). The psychology of numbers in the courtroom: how to make DNA match

    statistics seem impressive or insufficient. South California Law Review, 74, 1275. and Koehler, J. J.

    (2001). When are people persuaded by DNA match statistics? Law and Human Behavior, 25(5), 493–

    513.

    38

    [2] Attributed to mathematics professor Desmond MacHale of University College, Cork, Ireland.

    [3] http:en.wikipedia .orgwikiDeath_Valley.

    [4] As an example, suppose six adults spend the following amounts on lunch {12, 10, 10, 12,11, 11} and six children spend the following {4, 3.85, 4.15, 3.50, 4.50, 4}. The median (for

    an even number of observations, the median is sometimes taken as the mean between the two middle

    numbers, or in this case, the mean of 4.5 and 10) is 7.25. The mean and median are amounts that no

    one actually spends.

    [5] See Gelman, A., et al (2008). Red State, Blue State, Rich State, Poor State. Princeton, NJ:

    Princeton University Press.

    [6] These numbers are for white males and females. Non-white figures for 1850 are not as readily

    available. http:www.infoplease.comipaA5140.html. An additional source of concern is that the U.S.

    numbers for 1850 are for the state of Massachusetts only, according to the Bureau of the Census.

    [7] The title of this section, and the discussion, follows the work of Jenkins and Tuten very

    closely:Jenkins, James J; Tuten, J. Terrell. (1992). Why isn’ t the average child from the average

    family? And similar puzzles. American Journal of Psychology, 105(4) Winter, 517–526.

    [8] Stick-figure children from Etsy, https:www.etsy.comlisting221530596stick-figure-family-

    car-van-bike-funny; Small and large house drawn by the author; medium house from http:www.clipart

    best.comclipart-9TRgq8pac.

    [9] A simulation, see Tabarrok, A. (2014, July 11). Average stock market returns aren’ t average.

    http:marginalrevolution.commarginalrevolution201407average-stock -market-returns-arent-

    average. html. Accessed October 14, 2014.

    39

    第3章

    数轴的诡计

    虽然人类的大脑进化至今仍旧不能处理数量巨大的、以数字表示的

    数据文本,但人的眼睛却可以捕捉形象化数据所含有的模式。通过制作

    表格来展示每个单一的数值是一种呈现数据的方式。虽然这种方式呈现

    出来的数据最准确,但其可解释性却又最小。不过,对于绝大多数人来

    说,在这样的数据中识别模式和趋势比较困难,或者说几无可能。因

    此,我们需要依靠图表的辅助。图表一般分为两大类:一类使用形象化

    的方式来代表每一个数据点(如散点图);另一类采用的是数据缩减的

    方式,我们借以把数据汇总考查,比如只分析数据的算术平均数或中位

    数。

    使用图表操纵、扭曲和错误地呈现数据的方法有很多种。认真细致

    的信息接收者总能做到免受其害。

    数轴未做标记

    用统计图表说谎的最基本方法是在数轴上不做任何标记。如果不标

    记数轴,那么你就可以随意绘制图表!我们来看一个例子。在一个学术

    大会上,一个学生向听众展示了下面这样一张图(已重新绘制):[1]

    40

    这张图传达的是什么意思呢?从报告的文本中我们了解到,这个大

    会的议题是关于精神分裂症患者的大脑激活。那HCs又代表什么意思

    呢?我们不得而知,但从报告文本看——它所代表的内容是在与精神分

    裂症对比——所以我们猜想,它可能代表的是“健康管理”。现在,HCs

    和SZs两者看起来确实有不同之处,但是,嗯……图中的y轴标有数字,但却没有任何单位!我们面前的这张图到底代表什么?考试分数?大脑

    活动水平?激活脑区的数量?是他们吃掉的吉露牌布丁的数量,还是他

    们最近6周观看的、由约翰尼·德普(Johnny Depp)主演的电影数量?

    (公平地讲,参加这个大会的研究人员随后在一本由同行评审的期刊上

    发表了上图所示的研究结果,并且在一家网站指出图中的错误之后,对

    该图做了更正。)

    下面例子中的图是关于一家出版公司的销售总额的,并且剔除了营

    销初期的销售数据。[2]

    41

    这张图的情况正如前例一样,只不过这次的问题出在了x轴上。虽

    然x轴上标记了数字,但却没有说明数字代表的是什么。此例的情况多

    少有些不言自明:我们猜想2010年、2011年等指的是自然年度或财务年

    度,各年份之间的图形凹凸起伏说明是按照月份来取的数据(由于没有

    标记,所以我们只能猜想)。图中完全没有y轴,所以我们不清楚它衡

    量的内容(是销售单位,还是货币单位)。我们也不知道每条水平直线

    的意义。该图描述的可以是销售额从50美分年增长到5美元年,或者从

    5000万增长到5亿。不要担心,此图还附有一条有用的说明:“这又是一

    个收获很大的年份。”我们只好认同这种说法了。

    截短纵轴

    一张绘制精良的图能够清晰地向你展示出一个连续体相关的终止

    点。如果你记录的是数量的实际或预计变化情况,这一点尤为重要。因

    为你的目的是要让读者从图中得出正确的结论。如果你的图表示的内容

    是犯罪率、死亡、出生、收入或其他任何可以取0值的数量,那么0就是

    图的最低点。但如果你的目的是制造一种使人感到恐慌或愤慨的效果,42

    那么就要在接近图最低点的地方开始画y轴——这样做能够使你想要凸

    显的差异得到强化,因为人的眼睛会注意到图展示的差异大小,同时差

    异的实际大小却被弱化了。

    2012年,福克斯新闻播报了下面这张图,[3]

    其目的是说明如果布什

    总统的减税计划终止将会发生的情况。

    这张图给人的直观感觉是税率将会大幅上升:右边的条形图的大小

    是左边的条形图的6倍。谁希望自己要缴的税上涨5倍呢?有数字恐惧症

    的人或仓促之间看到这张图的人,也许根本没有时间仔细分析,所以他

    们发现不了实际的税率是从35%涨到39.6%。也就是说,如果布什总统

    的减税计划终止,实际税率的上涨幅度只不过是13%,并非该图所示的

    600%(4.6%的上涨幅度相当于起始税率35%的13%)。

    43

    假如y轴从0开始,那么13%的税率上涨幅度便一目了然:

    横轴或纵轴不连续[4]

    我们假设有这样一个城市:在过去的10年里,该市的犯罪率每年都

    以5%的速度增长。据此,也许你会画出如下这张图。

    44

    这张图并没有问题。假如你现在是一名家庭安全系统销售员,你想

    通过制造恐慌心理来促使人们购买你的产品。你使用与上面的图完全相

    同的数据,只要在x轴上截去一小段从而使其不连续,就可以扭曲真实

    情况,巧妙地骗过人们的眼睛(见下图):

    45

    该图给人的直观印象是犯罪率陡然上升了。不过,你对真实情况心

    知肚明。图中x轴上的不连续相当于把5年的数据强行用在了之前图中两

    年所占据的空间中,难怪犯罪率会明显上升。这就是绘图的一个基本缺

    陷,但由于大多数读者根本不会仔细地观察数轴,所以这样的图才侥幸

    得以存在。

    你大可不必束缚自己的创造力(只截断x轴),还可以通过在y轴上

    制造不连续来得到相同的效果,然后再把不连续之处加以掩盖。既然这

    里已经提到了,那么就让我们来截断y轴。

    46

    这样做多少有些卑劣的意味。大多数读者只会看图内的曲线,并不

    会留意竖轴上两个刻度的间隔刚开始时为40,刻度达到200后,相邻刻

    度的间隔为8。这是不是让人感觉非常有趣?

    诚实的做法是采用第一张图,其数轴的连续性比较合理。现在,如

    果要批判性地评估这个统计数据,那么你或许会问,数据的收集或表达

    方式是否存在某些掩盖了潜在事实真相的因素。

    一种可能的情况是,犯罪率的上升只发生在一个治安状况极其糟糕

    的社区,整个城市所有其他地区的犯罪率实际上都在下降。或许,警方

    和社区认定某个特定社区的治安已经无法管理了,所以终止了在那里的

    执法活动。整体来说,这个城市是安全的——甚至可能比从前还安全

    ——只有其中的一个社区是整个城市犯罪率上升的罪魁祸首。

    47

    另一种可能的情况是,我们把各种不同的社会抱怨混在了一起,然

    后将其全放在了“犯罪”这个包罗万象的类别中。由此,我们忽视了这样

    一个重要的考虑:也许,该城市的暴力犯罪率已经下降为0,所以警方

    腾出了大把的时间,转而把主要精力放在为那些走路不遵守交通规则的

    人开罚单上了。

    在努力理解这个统计数据的真正意义时,也许你会进一步提出一个

    最显而易见的问题:“在那段时期,这个城市的总人口出现了怎样的变

    化?”假如该城市的人口每年以高于5%的速度增加,那么整个城市的人

    均犯罪率实际上下降了。为了说明这一点,我们可以把该城市每10000

    人的犯罪数量绘制成如下这张图。

    选择恰当的刻度和数轴[5]

    48

    你在自己所在社区的房地产经纪公司工作,负责把过去10年本社区

    房屋价格的变化情况绘制成图。一直以来,房屋价格每年都以15%的速

    度稳定上涨。

    如果你想真正地为人们敲响警钟,为什么不改变x轴,把你现在还

    未拿到相关数据的年份也加到图中呢?像这样人为地在x轴上面增加额

    外的年份,可以实现压缩曲线的可视部分的效果并增加曲线的坡度,如

    下图所示。

    49

    请留意这张图怎样骗过了你的眼睛(不,你的大脑),让你得出两

    个错误的结论:第一,在1990年的某个时候,房屋价格一定很低;第

    二,到2030年,房屋价格将会飙升到几乎没有人买得起的地步。最好现

    在就购买一套房子!

    上述两张图都扭曲了真实情况,因为它们使一个稳定的增长率直观

    上看起来似乎变成了一个不断上涨的增长率。在第一张图中,y轴上

    2014年的15%的增长率似乎比2006年高了两倍。有很多事物都是以恒定

    速度变化的:工资、物价、通货膨胀、某个物种的数量以及疾病的受害

    者。[6]

    当你面对一种稳定增长(或下降)的情形时,最准确的数据呈现

    方法是使用对数刻度。当使用对数刻度时,相等的百分比变化会以y轴

    上的相等距离表示出来。所以,恒定的年度变化率则变成了一条直线,如下图所示。

    50

    可怕的双y轴

    只需知道绝大多数读者都不会仔细观察图这一点,图的制作者们便

    可以编制出各种谎言而依然能够侥幸成功。这种情况使得很多人对各种

    非真实的事情深信不疑。请思考下面这张图,它说明的是25岁的吸烟者

    和不吸烟者的预期寿命对比情况[7]。

    51

    这张图清楚地说明:一,吸烟的危害随着时间的推移而不断累积;

    二,吸烟者很可能比不吸烟者死得更早。在40岁时,这两类人死亡可能

    性的差别并不明显。但到80岁时,吸烟者死亡的可能性猛增了一倍还

    多,从30%增长到了60%以上。这种呈现数据的方法既简洁又准确。但

    假如你是一名年仅14岁的吸烟者,你很想说服父母让他们允许你吸烟。

    此时,这张图显然无法帮助你。所以,你便发挥自己的特长,使用双y

    52

    轴,即在该图的右边增加一个y轴。新增加的y轴采用不同的刻度,而且

    只适用于不吸烟者。这样,重新绘制后的图如下所示。

    53

    从上图中可以得知,无论吸烟与否,人们死亡的可能性几乎都是相

    等的。吸烟对你毫无害处,变老才会危及生命!双y轴的图带来的麻烦

    在于,你总是可以随意地更改第二个y轴的刻度。

    《福布斯》杂志历史悠久,是一个公认的可靠信息来源。该杂志曾

    使用过一张类似于上面的图,来说明公立学校每名学生的学习费用投入

    与他们的SAT[8]

    考试成绩之间的关系。[9]

    54

    从上图来看,似乎增加每名学生的学习费用投入(黑线)对于提高

    他们的SAT考试成绩(灰线)没有任何作用。那些反对政府财政支出的

    政客便可以借此宣扬,公立学校学生的学习费用投入是一项浪费纳税人

    税金的举措。但你现在已经明白,图中第二个y轴的刻度是可以随意选

    择的。假如你是一所公立学校的管理人员,也许你依然会采用相同的数

    据,但会改变图中右边数轴的刻度(见下图)。瞧!增加学生的学习费

    用投入可以使学生得到更好的教育,因为学生的SAT成绩确实提高了!

    55

    显然,修改后的图说明了完全不同的情况。哪张图反映了真实情况

    呢?你可能需要一种方法,来衡量一个变量如何随着另一个变量的变化

    而变化。这就是统计学中的相关性分析。相关系数的取值范围为–1到

    1。当相关系数为0时,说明一个变量和另一个变量毫不相关;当相关系

    数为–1时,说明当一个变量增长时,另一个变量却在下降,两个变量的

    这种变化完全同步发生;当相关系数为1时,说明当一个变量增长时,另一个变量也随之增长,二者的这种变化也完全同步发生。上面讨论的

    第一张图,说明了相关系数为0的情况,而第二张图说明了相关系数接

    近于1的情况。这个数据集实际的相关系数是0.91,关联度很高。至少

    在这个数据集中,当学生的学习费用投入越大时,其SAT成绩也会越优

    秀。

    使用相关性分析,还可以很好地预估你所研究的变量究竟可以对结

    果做出多大程度的解释。[10]

    0.91的相关系数告诉我们,通过研究公立

    学校为每名学生投入的学习费用,我们就可以解释91%的学生的SAT成

    56

    绩。也就是说,相关性分析告诉我们,学习费用投入可以在多大程度上

    说明SAT成绩的差异。

    2015年秋,在美国国会的一个委员会会议期间,一场围绕双y轴图

    的争论爆发了。当时,众议员詹森·查菲茨(Jason Chaffetz)展示了一

    张图。该图描述的是美国计划生育协会提供的两项服务:堕胎与癌症筛

    查和预防。[11]

    57

    当时,这位众议员试图提出这样一种政治观点:在7年之间,美国

    计划生育协会所提供的堕胎服务的数量增加了(他对此持反对意见),同时癌症筛查和预防服务的数量却减少了。虽然美国计划生育协会并没

    有否认这位众议员的观点,但是,在这张扭曲了事实的图中,堕胎服务

    的数量似乎超过了癌症筛查和预防服务的数量。或许该图的绘制者内心

    多少有些愧疚,所以还在数据点的位置标出了实际数字。我们暂时先接

    受图中的数据,然后进行仔细分析。图中,离现在最近的一年(2013

    年)的堕胎服务的数量是327000例,而癌症筛查和预防服务的数量几乎

    是其3倍,达到935573例(顺便提一下,堕胎服务的数字如此整齐,而

    癌症筛查和预防服务的数字又如此精确,不免有些让人心生疑虑)。这

    是一个非常凶险的例子:隐性的双y轴图居然两边都没有y轴!

    58

    如果该图绘制得当,应该如下所示:

    我们可以看到,堕胎服务的数量略微增长,而癌症筛查和预防服务

    的数量则呈现下降趋势。

    关于最初的那张图,还有一点让人感到怀疑:图中的线条非常平

    滑。这在数据图中非常罕见。绘图者很有可能选取了两个特殊年份——

    2006年和2013年的数据,并在比较了两者之后,将这两点用一条平滑的

    直线直接连接了起来。或许,他有意选择了这两个年份,目的是要强调

    差异;又或许,介于2007年和2012年中间的年份的相关数据波动很大。

    对此,我们均无法准确得知。平滑的线条给人一个完美的线性(直线)

    函数的印象,但这种情况极不可能出现。

    类似这样的图并非总能表达人们期望的那种意义。美国计划生育协

    会的任务就是尽可能多提供一些堕胎服务(同时对面临癌症死亡威胁的

    人弃之不顾)?除了这样的解释之外,难道就没有对上述数据的其他解

    释了吗?请看第一张图。2006年,美国计划生育协会提供了2007371次

    癌症筛查和预防服务,同时还进行了289750次的堕胎服务。它提供的癌

    59

    症筛查和预防服务的数量几乎是堕胎服务的数量的7倍。到2013年,两

    种服务数量的差距缩小了,但癌症筛查和预防服务的数量仍然几乎是堕

    胎服务数量的3倍。

    美国计划生育协会的主席西塞尔·理查兹(Cecile Richards)曾经对

    上述两种服务的数量差距的缩小做出了解释。一些抗癌服务项目在就医

    指南方面出现的变化,比如巴氏涂片检验,减少了需要做癌症筛查的人

    数。其他方面的变化,诸如社会对堕胎的态度、社会人口的年龄、卫生

    保健替代品的增加,都会影响美国计划生育协会提供这两项服务的数

    量。因此,图中的数据并不能够证明美国计划生育协会赞成堕胎。即使

    它赞成,这些数据也无法用作相关证据。

    [1] Tully, L. M.,Lincoln, S. H., Wright, T., Hooker, C. I. (2011). Neural mechanisms supporting

    the cognitive control of emotional information in schizophrenia. Poster presented at the 25th Annual

    Meeting of the Society for Research in Psychopatholog y. https:www.researchgate.net publi

    cation266159520_ Neural_ mechanisms_ supporting_ the_ cognitive_ control _ of_ emotional_

    information_ in_ schizophrenia. I first found this example at www.betterposters.blogspot.com.

    [2] http:pelgranepress.comindex.phptagbiz.

    [3] I’ve redrawn this for the sake of clarity. For the original, see

    http:loudfront.mediamatters.orgstaticimagesitemfbn-cavuto-20120731-bushexpire.jpg.

    [4] Spirer, Spirer Jaffe, op. cit.pp. 82–84.

    [5] Example from Spirer, Spirer Jaffe,op. cit., p. 78.

    [6] Spirer, Spirer Jaffe, op. cit., p. 78.

    [7] These data taken from Jha, P., Ramasundarahettige, C., Landsman, V., Rostron, B., Thun, M.,Anderson, R. N., . . . Peto, R. (2013). 21st-century hazards of smoking and benefits of cessation in

    the United States. New England Journal of Medicine, 368(4), 341–350, Figure 2A for women. Survival

    probabilities were scaled from the National Health Interview Survey to the U.S. rates of death from all

    causes at these ages for 2004 with adjustment for differences in age, educational level, alcohol

    consumption, and adiposity (body-mass index). I’m grateful to Prabhat Jha for her correspondence

    about interpreting this. This form of presentation is based on that of Wainer, H. (1997). Visual

    Revelations: Graphical Tales of Fate and Deception from Napoleon Bonaparte to Ross Perot. New

    York: CopernicusSpringer-Verlag.

    [8] SAT(Scholastic Assessment Test,即学术能力评估测试)是美国广泛采用的一种大学入

    60

    学标准化考试。——译者注

    [9] This example from Wainer, H. (1997). Visual Revelations: Graphical Tales of Fate and

    Deception from Napoleon Bonaparte to Ross Perot. New York: CopernicusSpringer-Verlag, p. 93. The

    original appeared in Forbes (May 14, 1990). Of course, there are other variables. Are the spending

    increases reported in actual or inflation-adjusted dollars? Was the time frame 1980–88 chosen to make

    that point, and would a different time frame make a different point?

    [10] There is some controversy about whether to use r or r-squared. For the defense of r, see: D’

    Andrade, R., and Dart, J. (1990). The interpretation of r versus r

    2 or why percent of variance accounted

    for is a poor measure of size of effect. Journal of Quantitative Anthropology, 2, 47–59. Ozer, D. J.

    (1985). Correlation and the coefficient of determination. PsychologicalBulletin, 97, 307–315.

    [11] Planned Parenthood Roth, Z. (2015). Congressman uses misleading graph to smear Planned

    Parenthood.msnbc.com, Sept. 29, 2015, 2:13 p.m. Politifact explored this issue further, examining the

    data between the endpoints and furnishing additional contextual information to go along with the usual

    graph-centered criticism. See https:perma.ccP8NY-YP49.

    61

    第4章

    恶搞数字汇报

    关于是否要买进一种新款汽水的股票,你正绞尽脑汁地思索着。这

    时,你在该公司的年度报告中偶然发现了这样一张销售数据图。

    上图显示,桃色可乐公司的销售业绩非常不错——销售额呈现稳定

    增长的趋势。现在来看,购买该公司的股票并不存在任何问题。但在此

    处,我们再运用一些现实知识可能会起到较好的作用。汽水市场的竞争

    62

    异常激烈,虽然桃色可乐公司的销售额正在增长,但也许并没有竞争对

    手的销售额的增长速度快。作为一名潜在的投资者,你真正需要分析的

    是桃色可乐公司与其他公司的销售额对比情况,或者说要分析该公司的

    销售额随着其所占市场份额的变化而呈现怎样的变化。当市场快速发展

    时,桃色可乐公司的销售额有可能只是略微上升,而其竞争者的市场收

    益则更大。下面展示的是一张非常有用的双y轴图。从该图所示的内容

    来看,桃色可乐公司的发展前景并不乐观。

    尽管我们知道,一些不道德的绘图者能够通过修改图中右侧y轴,使图呈现出他们想要的任何内容,但此处的这种双y轴图却无可指责,因为它的两个y轴分别代表不同的内容,其数量不可以共用同一个数

    63

    轴。这里的情况不同于前文有关美国计划生育协会的那张图。那张图把

    相同的数量(美国计划生育协会提供的服务),分别用两个不同的数轴

    来表示。尽管两个数轴衡量的是相同的内容,但为了操控读者的认知,它们却采用了不同的刻度。这样的做法扭曲了整张图。

    看一下桃色可乐公司的盈利状况也有助于你做出是否购买该公司股

    票的决定:利用在生产和销售方面的效率优势,该公司极有可能在销量

    较低的情况下获得更多的利润。有人援引了一项统计数据,或者向你展

    示了一张图,并不能表明他们所持的观点得到了证明。我们应当齐心协

    力,确保自己得到真正重要的信息,并且忽略那些无关紧要的信息。

    假设你在一家公司的公共事务办公室工作。该公司生产一种叫作

    Frabezoid的玩具。在过去几年,由于公众对该产品的需求一直很大,其

    销量逐年增长。通过新增生产设施、增加员工人数,以及为员工升职、加薪,公司扩大了经营规模。上司走进你的办公室,满脸阴郁。他解释

    说,公司最近的销售报告出来了,同上个季度相比,Frabezoid的销量下

    降了12%。公司总裁即将召开一次大型新闻发布会,商谈公司未来的发

    展前景。总裁在召开发布会时有一个惯例,即每次发布会上,他都要在

    身后的大屏幕上向与会者展示一张大图,以便介绍Frabezoid的销售情

    况。销量下降的事实一旦传扬出去,公众就有可能认为Frabezoid不再值

    得拥有了,这种情况会导致销量进一步下跌。

    你该怎么办呢?如果你如实地绘制一张过去4年里Frabezoid的销量

    图,那么它应该如下图所示。

    64

    图中曲线呈现的下降趋势正是问题所在。要是有办法把这段曲线变

    成上涨趋势该多好!

    是的,确实有办法!我们可以绘制累计销量图。不按照每个季度的

    销量绘图,代之以绘制每个季度的累计销量,即迄今为止的总销量。

    只要你哪怕销售一个Frabezoid,累计销量图都会呈现增长趋势,就

    像下面这张图一样。

    65

    如果仔细观察这张图,我们仍然可以发现一些蛛丝马迹,它们还是

    能够表明上季度的销售情况比较糟糕。尽管图中最近几个季度的销售曲

    线依然呈现上升趋势,但曲线的上升坡度却变小了。这就是销量下降的

    线索。不过,我们的大脑并不善于觉察这样的变化率(这在微积分中叫

    作一阶导数,即曲线斜率的术语名称)。因此,以平常人的眼光来看,该图似乎说明公司的销量表现依然十分强劲。如此一来,你便可以让为

    数众多的消费者相信Frabezoid依然值得拥有。

    在苹果公司最近召开的一次iPhone手机销售会议上,首席执行官

    (CEO)蒂姆·库克(Tim Cook)采用的正是这种方法[1]。

    66

    资料来源:2013 The Verge, Vox Media Inc. (live.theverge.comapple- iphone-5s-

    liveblog)

    在同一张图中绘制不相关的事物

    世界上有如此多的事物同时处于不断的变化之中,所以必定会出现

    一些巧合。公路上绿色卡车的数量也许和你的薪水同时在增加。在你的

    童年时期,电视节目的数量也许随着你身高的增长而增多。但是,这并

    不意味着其中的一件事物引发了另一件事物。当两个事物相互之间产生

    关联时,无论其中的一个是否引发了另一个,统计学家都称它们相关。

    有这样一句著名的格言:“相关并不暗含着因果关系。”形式逻辑对

    这个法则做了两种系统的阐述:

    (1)在此之后,即以此为因。

    67

    这种逻辑谬误产生于这样的认知,即认为由于Y发生在X之后,所

    以X导致了Y的发生。人们一般都会在早晨上班之前刷牙,但刷牙并不

    是人们上班的原因。在这个例子中,刷牙和上班的关系甚至可能正好相

    反。

    (2)与此同时,即以此为因。

    这种逻辑谬误产生于这样的认知,即认为由于两件事同时发生了,所以其中一件事必定是另一件事发生的原因。为了透彻地说明这个问

    题,哈佛大学法学院学生泰勒·维根(Tyler Vigen)曾经专门编写了一本

    书并创建了一个网站,全部以“假性共存—相关”作为专题,[2]

    比如下面

    这个。

    解释这张图的方法有四种:(1)溺水死亡导致了尼古拉斯·凯奇的

    电影上映;(2)尼古拉斯·凯奇的电影上映导致了游泳池溺水死亡事件

    的发生;(3)第三种因素(尚未查明)导致了上述两个事件的发生;

    (4)它们两者毫不相干,其表面上的相关性不过是巧合而已。如果我

    们不对相关和共存加以区别,那么就可以宣称,维根的图“证明”了尼古

    拉斯·凯奇具有防止游泳池溺水死亡事件发生的作用。此外,防止游泳

    池溺水的最好措施就是鼓励他少拍电影。这样一来,尼古拉斯·凯奇就

    68

    可以像他本人在2003年和2008年向世人展现的那样,不断地运用自己的

    有效救生技能。

    在一些情况中,具备相关性的事物之间其实并没有实际的联系,它

    们的相关仅仅是巧合而已。而在另外一些情形下,人们可以在相关的事

    物之间找到某种因果联系,或者至少可以编造一个合理的说法以便获得

    新的数据。

    我们可以直接排除第一种解释。因为电影的制作和上映需要时间,所以在同一年中溺水死亡事件的大量出现不可能导致尼古拉斯·凯奇电

    影的大量上映。那么第二种解释呢?或许,人们沉迷于尼古拉斯·凯奇

    电影的情节,结果导致他们失足落入游泳池并溺亡。对尼古拉斯·凯奇

    电影的沉醉,也可能同样提升了交通事故率和重型机械的受伤率。在做

    更多的数据分析之前,我们尚不得而知,因为该图对此并未进行说明。

    那么,存在第三种因素导致两件事同时发生,这种解释又怎样呢?

    我们可以猜想,经济发展趋势使这两件事情发生:经济发展得更好会促

    使人们在娱乐休闲活动方面增加投入,制作的电影越来越多,越来越多

    的人会去度假和游泳。如果真是这样,那么图中描述的两件事——尼古

    拉斯·凯奇的电影上映和游泳池溺水死亡,都不是彼此出现的原因。取

    而代之的是,第三种因素,即经济发展,导致了两者的发生。统计学家

    将其称为解释相关性的第三种因素,这方面的例子为数众多。

    可能性较大的情况是,这两件事情并不相关。如果我们花足够多的

    时间和精力,那么必定能够发现两个不相关的事物彼此并不相同。

    随着穿短裤的人越来越多,冰激凌的销量也会上升。这两件事并不

    相关,导致它们产生的第三种因素是夏天气温升高。在你的童年时期,一年之中播放的电视节目数量可能与你的身高增长相关,但是促使这两

    件事发生的毫无疑问是电视扩大市场的时代和你身高增长的阶段恰好处

    于同一时期。

    69

    那么,怎样知道具备相关性的事物之间存在因果关系呢?一种方法

    是做控制实验,另一种方法则是应用逻辑推理。但是,一定要谨慎处

    理,否则你很容易陷入语义学的困境之中。导致人们穿雨衣的原因,是

    外面下了大雨,还是人们不想被雨水淋湿(下雨的后果)?

    兰德尔·门罗(Randall Munroe)曾经在他绘制的网络漫画《xkcd》

    中巧妙地回答了这个问题。[3]

    有两个明显都是大学生的火柴人正在交

    谈。其中一个说,他以往总认为相关性暗含着因果性。后来,他去上了

    统计学课程。现在,他不再这样认为了。另一个学生说:“听起来好像

    统计学课程起作用了。”第一个学生回答说:“嗯,也许吧。”

    欺骗性插图

    利用统计学说谎的人经常会使用信息图来引导舆论,他们凭借的正

    是大多数人不会深究由其精心筹划的信息。请思考下面这张图,它可用

    于吓唬你,让你相信恶性通货膨胀正在吞噬你的血汗钱。

    70

    乍一看,这张图的确很吓人。请你再仔细观察一下,图中的剪刀裁

    剪美元的位置并不是整个纸币的4.2%处,而是大约42%的地方。当你的

    视觉系统和逻辑思维系统二者产生矛盾时,除非你费尽全力去克服视觉

    上的偏见,否则最终获胜的往往是视觉系统。[4]

    准确的信息图如下图所

    示,但它给人们情感上带来的冲击力却弱化了很多。

    71

    解释说明和统计样本单位

    一般情况下,统计数据的收集和汇报工作都能够比较恰当地得以完

    成。但是对于某些人来说,比如记者、律师,以及任何非统计学专业人

    士,他们在报告统计数据时往往会犯错。要么是因为他们误解了统计数

    据,要么是因为他们没有意识到措辞方面的一些细微变化会改变其含

    义。

    那些想要使用统计学知识的人往往找不到现成的统计学家来帮忙,所以他们只好让缺乏专业培训的人来解答自己在统计学方面的疑问。公

    司、政府机构、非营利组织以及传统的夫妻式杂货店,都会从诸如销

    量、顾客、趋势、供给链等统计学数据中获益。在运用统计学知识的任

    72

    何阶段,比如在实验性设计,数据的收集、分析或解释过程中,都会出

    现使用者不能胜任统计工作的情况。

    汇报的统计数据有时并不恰当。如果你正在说服股东,让他们相信

    你的公司经营状况良好,那么或许你会发布有关年度销量的统计数据,并且向他们展示公司的销量呈现稳定增长的趋势。然而,如果你的公司

    的产品的市场正处于扩张期,那么产品销量的增长原本就是可以预见

    的。投资方和分析人士真正想要了解的极有可能是你的公司的产品的市

    场份额是否出现了变化。假如由于竞争者突然发难,抢走了你的消费

    者,导致你的市场份额出现下滑趋势,那么怎样才能使销售情况报告仍

    然看起来很有吸引力呢?你只需要对真正相关的市场份额统计数据不予

    报告,而代之以报告销量的统计数据。销量在不断上升!一切都没有问

    题!

    人们在25年前的按揭申请中所显示的财务状况,对于建立今天的风

    险模型来说,很可能没有什么用处。网站上的消费者行为模式很快就会

    变得过时。[5]

    建造过街天桥时所用的混凝土的整体性统计数据,与统计

    建设桥梁所用的混凝土的整体性数据,也许毫无关联(即使两个建设工

    程刚开始时都使用同一种混凝土,湿度和其他因素也有可能使其出现偏

    差)。

    你可能听说过类似“45的牙医都推荐患者使用高露洁牙膏”这样的说

    法。这是真实情况。这些已有几十年历史的广告,其背后的广告代理商

    想让你相信,牙医们最看好高露洁而非其他品牌的牙膏。这却不是真实

    情况。英国广告标准局曾针对以上说法展开仲裁调查,并最终裁定它是

    一种不公正的说法。其原因在于,高露洁公司的调查问卷允许牙医们推

    荐的牙膏不止一种。事实上,高露洁最大的竞争者的品牌名称在该问卷

    中出现的频率几乎和高露洁一样(在高露洁广告中你却看不到这个细

    节)。[6]

    73

    本书有关平均数的部分曾涉及统计样本单位这个问题,在有关图的

    部分也对该问题含蓄地做了讨论。如果你不仔细思考人们传递给你的信

    息,那么凭借对统计样本单位的操纵,人们就可以用无数个手段来欺骗

    你。有线电视网络公司C-SPAN(美国一家提供公众服务的非营利性媒

    体公司,由美国有线电视业界联合创立)的一条广告声称,其服务范

    围“可覆盖”一亿个家庭。[7]

    这并不意味着有一亿人在收看C-SPAN的节

    目,甚至还有可能意味着没有任何一个人在收看它的节目。[8]

    对统计样本单位的操纵还能够影响公共政策。一项针对洛杉矶市区

    各街道垃圾回收量的调查显示,其中一条街道的垃圾回收量是其他街道

    的2.2倍。在市政局为该街道的居民颁发奖章,表彰他们为绿色城市建

    设所做的贡献之前,我们先来问问怎么会出现这样的数字。一种可能的

    情况是,这条街道的居民人数比其他街道多两倍以上——也许是因为街

    道很长,也许是因为该街道上有很多公寓楼。除非整个市区的街道都相

    同,否则,以街道为单位来衡量垃圾回收量就是不恰当的统计。更好的

    统计方法是按照住户(衡量每个家庭的垃圾回收量)来统计。由于人口

    多的家庭的物质消费比人口少的家庭要多,所以以个人为单位统计垃圾

    回收量是最好的做法。也就是说,我们要调整垃圾回收数量的统计样本

    的单位,把街道上的居民人数考虑在统计当中,因为这才是这项统计工

    作正确的统计样本单位。

    2014年,整个加利福尼亚州干旱肆虐。同年,《洛杉矶时报》对加

    州兰乔圣菲市的居民用水情况进行了报道。[9]

    “9月,该地区住户平均每

    天耗用的水量几乎是加州南部沿海家庭每天用水量的5倍。这为他们赢

    得了‘全加州最大民用水挥霍者’这个不光彩的名声。”但是,住户并不是

    这项统计恰当的统计单位。更好的统计单位应当是个人——一种可能性

    是兰乔圣菲市居民的家庭规模更大,这就意味着洗澡的人更多,洗碗的

    人更多,使用冲水马桶的人也更多。另一种可能性是,以英亩[10]

    为统

    计单位,兰乔圣菲市住户的家庭占地面积往往更大。也许为了防火和其

    74

    他原因,住户在土地上都种上了绿色植被。所以,兰乔圣菲市住户的占

    地面积虽然较大,但是每平方英亩消耗的水量却并不比加州其他地方

    多。

    实际上,在《纽约时报》发表的一篇针对同一问题的文章中,我们

    可以找到有关这方面的一些暗示:“州政府负责民用水的官员曾提醒大

    家,不要对比各地区之间的人均用水量。他们表示,他们预计地产面积

    很大的富裕社区的用水量最高。”

    上述文章的问题在于,它们对数据做了调整,目的是使兰乔圣菲市

    居民的用水量看起来好像超出了配额。但是,它们提供的数据——正如

    上文中有关洛杉矶垃圾回收的例子一样——实际上并没有证明其目的。

    采用计算比例而不计算实际数字的方法,往往有助于提供正确的统

    计样本单位。假设你是一家公司的西北地区销售经理,负责销售的产品

    是通量电容器(flux capacitor,1985年电影《回到未来》中提到的时间

    机器的核心部件)。虽然你的销量已经提高了很多,但仍然比不上公司

    销售方面的“涅墨西斯”(希腊神话中的复仇女神,此处喻指不能战胜的

    对手)——来自西南销售区的杰克。这几乎没有公平可言,他负责的地

    区不仅地理面积更大,而且人口更多。然而,公司会根据你向上级展示

    的产品销售能力发放奖金。

    有一种方法可以合理地汇报你的销售业绩:根据你负责地区的面积

    和人口来汇报销量。换言之,在绘制销量图时,要按照销售区内平均每

    人或每平方英里的销量,而不是按照通量电容器的销售总量。采用这两

    种方法中的任何一个,你的销售业绩都会比别人优秀。

    新闻报道表明,2014年是飞机失事最为严重的年份之一:全年发生

    22次飞行事故,造成992人死亡。但是,如今的飞机其实比以往更加安

    全。[11]

    由于现在的航班数量比以往多得多,992的死亡数字相对于每

    100万名乘客(或每100万英里的飞行距离)的死亡数字来说,其实代表

    75

    着很大幅度的下降。在一家主流航空公司的任何单程飞行过程中,你死

    于飞机失事的概率大约为五百万分之一。这比你死于其他任何活动的概

    率都要小,比如步行穿过街道和吃东西(噎死或食物中毒致死的概率比

    死于飞机失事的概率还要高1000倍)。在此处,比较的基准非常重要。

    这些统计数据的时间跨度都是一年。我们还可以改变统计基准,转而分

    析一小时内这些活动的情况,而这将改变整个统计量。

    似是而非的差异

    当我们试图弄清楚两个待处理对象之间是否存在差异时,常常需要

    运用统计学知识:同一块土地上施用的两种化肥、两种不同的止痛药、两种截然不同的教学方法、两组不同的薪水(比如,做同一种工作的男

    人和女人的薪水)。两个待处理对象存在差异的原因有很多种:它们之

    间可能确实存在差异;统计样本中可能存在混淆因子,它们却与实际的

    统计对象毫不相干;计量方法可能有误;还可能存在随机变异——出现

    了一种小概率差异,它有时出现在方程的一边,有时出现在另一边,这

    要取决于你查看的时间。研究者的目标在于寻找稳定、可靠的差异,而

    我们则要努力把差异和实验误差区别开来。

    不过,我们对于新闻媒体使用“显著”一词的方式一定要保持警惕。

    因为对统计学家来说,这个词语的含义并不是“显著”。统计学中的“显

    著”指的是统计结果通过了数学测试,比如t测验、卡方检验、回归分析

    以及主分量分析等(这样的测试方法有几百种)。统计学意义上的显著

    性测试,可以对用纯粹巧合解释统计结果的容易度进行量化。当统计对

    象数量庞大时,即使程度上很琐碎的小差异都能够超出变化和随机模式

    解释的范围。这些测试并不能知晓哪个差异具有显著性,这是一种人为

    判断。

    在两个统计群组当中,你的统计对象越多,就越有可能找到各个统

    76

    计对象之间的差异。假设我要测试两种汽车——福特汽车和丰田汽车的

    年度维修成本,我所采用的方法是,看一下每种汽车(各10辆车)的修

    理记录。比方说,假定福特汽车每年维修成本的算术平均数比丰田汽车

    高8美分。这个小差异极有可能达不到统计学意义上的显著,而且很明

    显的一点是每年8美分的维修成本差异不会成为选择购买哪种汽车的决

    定因素——由于差异太小,因此无须考虑。但是,如果我看的是500000

    辆汽车的修理记录,这个8美分的差异便具有了统计学上的显著性。但

    是,从实际意义来说,这个差异却无关紧要。类似地,一种治疗头疼的

    新药物可能在统计学意义上能更迅速地治愈你的头疼,但如果只是快了

    2.5秒,谁又会在意它呢?

    内插法和外推法

    星期二,你走到屋外的花园里,看见了长到4英寸[12]

    高的蒲公英。

    星期四,你又看了一眼,蒲公英已经长到6英寸。那么,星期三时蒲公

    英有多高呢?我们不能确切地知道答案,因为我们并没有在星期三时测

    量蒲公英的高度(同一天,你从苗圃店里购买了除草剂,回家的路上还

    遇到了堵车)。但你却可以猜测:星期三时蒲公英的高度有可能是5英

    寸,这就是内插法。内插法指的是利用已知的两个数据点,估算出你想

    要知道的位于这个两点之间的那个点的数值。

    6个月后,蒲公英会长到多高呢?如果它每天生长1英寸,你就可以

    回答说6个月(约180天)后它将长高180英寸,长到186英寸,或者说高

    度超过15.5英尺。此处,你所使用的方法就是外推法。但是你见过这么

    高的蒲公英吗?一般人都没见过。因为当蒲公英长到一定高度时,其自

    身的重量会把它压倒,或者它会死于其他自然方面的原因,或者被人踩

    踏,又或者会被除草剂除掉。内插法并不是一种十全十美的方法,但如

    果两个观察对象相互间的关系非常紧密,那么使用内插法一般都能做出

    77

    较好的估计。使用外推法的误差则更大,因为你的估计已经超出观察对

    象的范围。

    一杯咖啡的温度降到室内温度所需要的时间,是由牛顿热力学定律

    决定的[13]

    (还受到其他因素的影响,比如气压和杯子的组成成分

    等)。如果你的咖啡的起始温度为145华氏度(62.78摄氏度),那么随

    着时间的推移,你会观察到其温度降低的情况如下表所示。

    你的咖啡的温度每分钟会降低5华氏度。如果你在两个观察点之间

    进行内插,比方说,你想知道两个测量时间点中间咖啡的温度,那么你

    的内插所得数值将会非常准确。但如果你从上述温度模式中进行外推,那么你很有可能得到一个荒谬的结果,比如说30分钟后咖啡的温度将会

    降至冰点。

    78

    外推法没能考虑到这样一个物理学上的限制条件:咖啡的温度不可

    能降到室温以下。同时,外推法还忽略了另外一个情况:当咖啡的温度

    降到与室温接近时,下降的速度会减缓。所以,咖啡冷却函数图形的其

    余部分应当如下图所示。

    79

    请留意,图中前10分钟内的曲线坡度在10分钟之后没有继续保持

    ——曲线变得平直了。这说明,当你使用外推法时,有两件事情非常重

    要:(1)必须要有大量的观察点;(2)必须具备关于所统计事件发生

    过程的一些知识。

    精确度和准确度

    当我们看到数字具有精确度时,往往会认为它们也具备准确度。但

    事实上,精确度和准确度并不是一回事。如果我说“如今很多人都在购

    买电动汽车”,你会认为我只是在做猜测。如果我说“售出的新汽车中有

    16.39%是电动汽车”,你就想当然地认为我所说的是实际情况。可是,你却混淆了精确度和准确度。上述数据有可能是我编造的,也有可能是

    80

    我在电动汽车4S店附近的少数人中抽取了统计样本。

    请回想一下我在上文中提到的《时代周刊》的那个标题,即“使用

    手机的人比用马桶的人还多”。这种表述并非不合理,但却是对事实的

    一种扭曲,因为联合国的一项研究表明事实并非如此。联合国的研究报

    告称,可以使用手机的人比可以使用马桶的人多。我们知道,这种表述

    又完全是另外一回事。几十个人可以共同使用同一部手机。尽管全球范

    围内卫生设施的缺乏仍然令人忧心,但该杂志的标题听上去让人觉得,假如你去统计数量,会发现世界上的手机数量比马桶还要多。然而,这

    种观点并没有数据的支撑。

    当你在统计学中见到类似“可以使用到”这样的表述时,一定要提高

    警惕。人们可以使用到医疗保健服务,不过这意味着这些人的居住地距

    离有医疗设施的地方比较近,并不是说这些医疗场所就一定会接纳他

    们,或者人们就一定能够负担得起医疗费用。正如你在上文中已经了解

    到的那样,尽管C-SPAN公司的电视节目可以覆盖到1亿个家庭,但它并

    不能表明有1亿人在收看该公司的电视节目。[14]

    只要能够说明,世界总

    人口中有90%的人位于互联网连接点、铁路、道路、飞机起落跑道、港

    口或狗拉雪橇路线等周边25英里之内,那么我就可以宣称,全世界有

    90%的人都“可以阅读到”本书。[15]

    比较截然不同的事物

    用统计数据说谎的一种方式是对比不相同的事物,比如比较数据

    集、人口、产品类型等,并且假装它们是相同的。正如一句古老的谚语

    所说,你不能对比苹果和橘子(比喻截然不同的事物)。

    采用较隐蔽的方法,你就可以宣称,战争时期(比如阿富汗战争)

    在部队服役要比待在美国本土舒适的家里更为安全。这种说法的推理起

    81

    点是:2010年,有3482名美国现役军事人员丧生。[16]

    鉴于美国军队的

    总人数为1431000人[17]

    ,所以军队现役人员每1000人中就有2.4人牺

    牲;而2010年,全美国每1000人中死亡的人数为8.2。[18]

    换言之,身处

    作战地区的军人的安全率是居住在美国本土的人的3倍多。

    这是什么情况呢?上述两个统计样本没有相似性,所以不能直接将

    其加以比较。现役军人一般都是健康状况良好的年轻人。这些人的伙食

    很好,医疗条件也很好;而美国总人口却包括了老年人、病人、黑帮成

    员、瘾君子、飞车党、掷刀游戏(一种儿童技巧游戏,不能让掷出的刀

    子在地上呈竖立状态的玩家,即被罚以用牙齿拔地上的刀)玩家,以及

    很多饮食和医疗条件都很差的人。[19]

    所以,无论身处何地,美国大众

    的死亡率都较高。美国军队现役人员并非全部都身处作战地区——其中

    一些人待在非常安全的军事基地,或坐在五角大楼的办公室里,抑或驻

    扎在位于郊区零售商场的部队征兵处。

    《美国新闻与世界报道》曾经刊载了一篇文章。该文比较了20世纪

    30年代美国全国范围内分别支持民主党和共和党的选民人数比例。它的

    问题在于,统计抽样方法已经随着时间的流逝而发生了变化。在20世纪

    三四十年代,人们采用的抽样方法是现场采访或信件邮递,而到了70年

    代则通过电话采访进行抽样调查。20世纪早期的电话抽样结果偏向于那

    些拥有座机的人,即富裕阶层。至少在那个年代,富裕的选民倾向于投

    票支持共和党。进入21世纪,手机成为抽样调查的途径。此时的抽样结

    果则偏向于那些选择支持民主党的年轻选民。我们无法确切地知道,20

    世纪30年代以来,支持民主党和共和党的选民人数的比例是否发生了变

    化。原因在于,相关的统计样本相互之间存在矛盾之处。我们普遍认为

    自己研究的是同一件事情,但事实上却并非如此。

    当我们做一份比较报告,对比现在和30年前摩托车事故死亡率的下

    降情况时,同样会出现上述问题。相比于以两轮摩托为主的20世纪,距

    离现在越近的年份,三轮摩托的数量越多。你比较的也有可能是这样的

    82

    两个对象,即法律尚未要求必须佩戴头盔的年代与多数州都要求佩戴头

    盔的现今时代。

    在做统计结论之前,一定要当心样本方面的变化!《美国新闻与世

    界报道》曾撰文写到,医生数量在12年里增加了,而同一时期医生的平

    均工资则显著下降。[20]

    读者会从中获取什么信息呢?你或许会下结论

    说,由于医生人数太多,所以现在不是选择成为医生的好时机。而且,由于医生人数大于社会需求,所以每个医生的薪水都下降了。你的结论

    可能是正确的,但在上述报道中却没有证据可以支撑这个结论。

    另一种同样合理的观点认为,在12年里,专业分工的深入和医疗技

    术的进步为医生创造了更多的就业机会,所以医疗行业的职位增加了,医生的总人数也随之增长。那么,医生薪水下降又怎样解释呢?也许,很多年老的医生退休了,年轻医生则填补了他们的职位。由于这些年轻

    医生从医学院毕业后刚刚参加工作,所以他们的薪水要低一些。不过,我们也找不到可以支撑这种观点的论据。一个人在统计学方面的一个重

    要素养,即在于能够认识到,对于一些统计数据,就像上面列举的那

    样,不能够简单地对其加以解释。

    有时,人们之所以会比较截然不同的事物,是因为它们来自不一致

    的次级样本,即人们忽略了一个自己尚没有认识到其重要性的细节。例

    如,当从一块施用了新品种化肥的农田中抽取玉米样本时,你也许并没

    有注意到,一些玉米穗获得的日照更多,而另一些玉米穗吸收的水分更

    多。再比如,在研究交通模式如何影响街道路面的重新铺设时,你可能

    没有意识到,某些街道表面的水流更多,从而影响了所需要的沥青数

    量。

    统计样本的混合是指把不相同(不同种类)的事物全部放在同一处

    或归入同一类别——对比截然不同事物的一种形式。如果你考察的是由

    同一家工厂生产的有缺陷齿轮的数量,那么你就有可能把两种完全不同

    83

    的齿轮放在一起计数,从而使最终的统计数字满足你的特定目的。

    下面我们举一个公共政策方面的例子。试想,你计划调查青春期前

    的少年和青春期青少年的性行为。你如何混合(合并在一起)数据在很

    大程度上会影响人们怎样看待你的数据。如果你的调查研究旨在为青少

    年教育和咨询中心筹集资金,你可以采用发表一份统计数据的方法,比

    如“年龄在10岁到18岁的学龄青少年中有70%的人属于性欲旺盛者”。有

    没有更好的方法呢?如果说十七八岁的青少年性欲旺盛,我们并不会感

    到吃惊,但居然说10岁的孩子也这样!这种方法不仅肯定会让孩子的祖

    父母们感到悲伤难过,而且也会促使他们立即交钱送孩子到青少年教育

    和咨询中心。显然,10岁至18岁这个单一的类别把那些有可能性欲旺盛

    的青少年和其他并非如此的孩子完全混为一谈。对把年龄相似且有相似

    体验的青少年个体混杂在一起的分类方法进行拆分,就是比较有益的做

    法。比如,可以将其分为10岁至11岁、12岁至13岁、14岁至15岁、16岁

    至18岁等不同类别。

    上述调查本身存在的问题并非仅此一个。所谓的“性欲旺盛”是什么

    意思呢?调查人员究竟向学生们提了哪些问题?或者,他们到底有没有

    向学生提问?也许被提问的只是学生的父母们。各种主观上的偏见都会

    融入类似这样的统计数字。“性欲旺盛”的含义尚待商讨,它的定义会使

    被调查对象对问题的回答出现很大的不同。当然,被调查者也可能不讲

    真话(报告偏差)。

    我们再举一例。假如你想把失业问题作为一个一般性的问题来探

    讨,那么就存在这样一种风险,即把背景情况很不同的人和真正的失业

    者混杂到一起。一些人身体上有残疾,所以无法参加工作;一些人由于

    在工作中偷窃或醉酒因而让雇主有正当理由将其解雇;有一些人想要工

    作却没有接受过相关培训;一些人在监狱服刑;还有一些人不打算再工

    作了,因为他们已经回到学校学习、加入了修道院或者靠家里来养活自

    己。当用统计数据来影响公共政策,或者为某事筹集善款,抑或营造社

    84

    会舆论时,人们经常会忽视统计样本的细微差别,但正是这些细微的差

    别造成了完全不同的统计结果。

    统计样本的细微差别本身往往揭示了数据的模式。[21]

    人们成为失

    业者的原因不尽相同。酗酒和偷窃的人成为失业者的可能性要比其他人

    高4倍。这些数据模式所蕴含的信息丧失在了混合样本当中。把这些因

    素作为你的数据的一部分,将有助于你弄清楚哪些人是失业者及其失业

    原因,最终可以促使那些真正需要就业培训的人得以接受相关培训,或

    者促使那些匿名戒酒中心数量不足的城镇增加其数量。

    如果从事行为跟踪研究的研究人员和机构采用事物的不同定义,或

    者采取不同的观测事物的程序,那么最终的统计数据就会变得非常不同

    甚至混杂。如果你想确定那些同居但尚未正式结婚的情侣的数量,那么

    你就可能需要借助于由不同的县和州的相关机构此前收集到的相关数

    据。但在此处,采用不同的定义会产生一个分类上的问题:怎样算是同

    居?它是由一周内两个人一起过夜的数量来决定的吗?还是要看他们的

    个人所有物的所在地,抑或要看他们的通信地址?在一些司法管辖区

    内,同性情侣是合法的,而其他地区则不然。如果你使用不同的方案在

    不同的地区采集数据,最终的统计数据就没有什么意义了。当各个数据

    采集点之间在数据的记录、收集和计量方法上存在较大的差别时,最终

    统计结果的意义就有可能并不是你所认为的那样。

    最近有一个报告表明,西班牙年轻人的失业率达到了令人惊诧的

    23%。该报告其实把一般来说应当出现在不同类别中的人混杂在了同一

    个样本之中:它把没有找工作的学生也算作失业人员,同时还把刚被解

    雇的工人和正在找工作的工人也归入失业人员之列。

    在美国,人们用6个不同的指数(分别命名为U1至U6)来跟踪失业

    情况(由劳动统计局统计)。[22]

    这些指数反映了对“失业”真实含义的

    不同解释。它可以包括正在找工作的人、在学校里但没找工作的人,以

    85

    及那些在公司做兼职工作但正在谋求一个全职工作的人等。

    2015年7月,《今日美国》报道称,美国的失业率下降到了

    5.3%,“这是自2008年4月以来的最低值”。[23]

    综合性更强的新闻机构,包括美联社(AP)、《福布斯新闻》和《纽约时报》均报道了失业率

    明显下降的原因:很多失业的人放弃了寻找工作,所以从技术上来讲已

    经不能再将其视为工作人口了。[24]

    统计样本的混合并不总是错误的。你或许会选择把学校里男生和女

    生的考试成绩进行混合,尤其在不能证明他们的成绩不相同的情况下

    ——实际上,为了增加你的统计样本(这样可以为你的研究提供一个更

    稳定的估计),这样做反而比较好。对统计类别的定义无论是过于宽泛

    (如前文提到的性行为情况调查),还是不一致(如关于同居情侣的统

    计),都会带来统计解释上的问题。但如果统计类别定义得恰当,那么

    样本的混合则有助于我们做出有效的数据分析。

    假设你在犹他州政府里面工作,适逢一家全国性的婴儿服装制造公

    司计划搬到犹他州。你正在思考,如果自己能证明犹他州新生婴儿的数

    量很大,那么就能更好地吸引该公司到犹他州来。因此,你登录政府人

    口普查网站Census.gov,并绘制了一张关于美国各州新生婴儿数量的

    图。

    86

    从图上看,犹他州在新生儿数量方面要高于阿拉斯加州、华盛顿特

    区、蒙大拿州、怀俄明州、南达科他州、北达科他州以及东北部几个面

    积较小的州。但是,与加利福尼亚州、得克萨斯州、佛罗里达州及纽约

    州相比,犹他州却并不能算是出现了婴儿潮。不过,请等一等。你所绘

    制的这个图展示的是新生儿的原始数据,所以它必然会显得比较有利于

    那些人口数量更大的州。与此相反,你还可以按照各州总人口中每1000

    人的新生儿数量来重新绘制此图,结果如下图所示。

    87

    看来,这个方法也没有奏效。犹他州的新生儿数量看上去似乎和美

    国其他各州并无分别。怎么办呢?修改图下面颜色由灰到黑的长方形格

    子所代表的数字范围!你可以很轻易地改变每个类别中的数值。通过把

    犹他州的婴儿出生率单独放在一个方形格子中,你就可以使犹他州在美

    国其他州中脱颖而出。

    88

    当然,这个方法之所以奏效,是因为犹他州的婴儿出生率确实在美

    国各州中最高——虽然并没有高出很多,但仍是最高的。选择一个由带

    颜色的方形格子代表的样本类别,并把犹他州的婴儿出生率数值单独放

    在其中,犹他州便凸显出来。假如你想把其他州中的某一个凸显出来,那么就需要采用其他种类的编造方法,比如按照每平方英里、平均每个

    沃尔玛商场,抑或人均可支配收入,来绘制新生儿数量图。只要你努力

    地反复尝试上述方法,最终总能够找到一种衡量标准,从而为美国50个

    州中的任意一个绘制一张这样的图。

    什么才是绘制此类图的正当方式,是那种不撒谎的方式吗?这个问

    题属于价值判断的范畴。不过,相对中庸的一种做法是,在5个类别

    中,每类都保证20%的州数,即在每个带颜色的格子中,放入相同个数

    的州。

    89

    另外一种方法是使每个方形格子所代表的婴儿出生率范围相等。

    90

    此类的统计学障眼法——除了上述最后一张图之外,其他图均使用

    了不相等的方形格子宽度——不仅非常普遍,而且经常出现在直方图

    中。下图描述了2015赛季美国职业棒球大联盟排名前50的球员的平均击

    球率[25]

    (包括全美和美国职业联盟)。

    91

    现在,假设你是其中一名击球率为0.327的球员,你的排名属于第

    二高的那个类别。球员奖金即将发放,今年你不再想给球队管理层任何

    拒绝给你奖金的理由——你已经购买了一辆特斯拉汽车。所以,修改图

    中方格子的宽度,把你的击球率结果数字与其他两位击球率达到0.337

    的球员混合在一起。如此一来,你就进入年度最佳球员之列了。在具体

    绘图时,把图出现的缺口补齐(因为0.327的方格子中已经没有球

    员),从而在x轴上创造出一段几乎没人可以注意到的不连续的数字间

    隔。

    92

    似是而非的样本类别细分

    与样本类别混合相反的做法是样本类别细分,它也能使人们相信各

    种虚假信息。为了把X说成是导致Y出现的首要原因,我只需要把其他

    原因细分为越来越小的类别。

    假设你在一家生产空气净化器的公司工作,你需要完成这样一项工

    作:证明在美国,呼吸道疾病是导致死亡的首要疾病,它排在心脏病和

    癌症之前。事实上,截至今天,美国排在第一位的致死性疾病仍然是心

    脏病。美国疾病控制与预防中心报道称,2013年致死率排名前三的疾病

    [26]

    为:

    93

    心脏病:611105例

    癌症:584881例

    慢性下呼吸道疾病:149205例

    现在,我们抛开家用空气净化器有可能无法显著地预防呼吸道疾病

    这样令人烦心的细节性问题不谈,上面这些统计数字并不能突出你公司

    产品的重要性。你也很想每年拯救超过100000条生命,这一点毋庸置

    疑。但是,从产品营销的角度来看,诸如你公司“致力于预防致死率排

    在第三的疾病”之类的宣传说法,并不能给人留下深刻的印象。但,请

    等一等!心脏病并非只有一种,它有很多种:

    急性风湿热和慢性风湿性心脏病:3260例

    高血压性心脏病:37144例

    急性心肌梗死:116793例

    心力衰竭:65120例

    像这样的心脏病种类还有很多。下一步,我们把癌症也细分为更小

    的次级类别。通过不对样本种类进行混合,并且创造出这些非常好的细

    分类别,你就成功做到了——慢性下呼吸道疾病现在俨然成了致死率最

    高的疾病。你也已经为自己赢得了一份奖金。一些食品公司就采用了这

    种细分样本类别的策略,从而隐藏了其产品中脂肪和糖分的含量。

    [1] http:qz.com122921the-chart-tim-cook -doesnt-want-you-to-see;

    http:www.tekrevue.comtim-cook-trying -prove-meaningless-chart.

    [2] http:www.tylervigen.comspurious -correlations.

    [3] https:xkcd.com552.

    [4] This example is based on one in Huff, ibid.

    94

    [5] This is nearly a direct quote from De Veaux, R. D. Hand, D. J. (2005). How to lie with bad

    data. Statistical Science, 20(3), 231–238, p. 232.

    [6] I thank my student Vivian Gu for this example. Derbyshire, D. (2007, January 17). Colgate

    gets the brush-off for “misleading” ads. The Telegraph. Retrieved from

    http:www.telegraph.co.uknewsuknews1539715Colgate-gets-the-brush-off-for-misleading-ads.

    html.

    [7] http:www.c-span.orgabouthistory.

    [8] Nielsen reports that Americans, on average, receive 189 channels but watch only 17 of them.

    http:www.nielsen.comuseninsightsnews2014changing-channels-americans-view-just-17-

    channels-despite-record-number-to -choose-from.html.

    [9] Boxall, B. (2014). Water world: Rancho Santa Fe is leading the state in residential usage. Los

    Angeles Times, December 2, 2014, p. AA1. http:www.latimes.comlocalcaliforniala-me-water-ranc-

    ho-20141202-story.html. Lovett, I. (2014). Where grass is greener, a push to share drought’ s burden.

    New York Times, November 30, 2014, p. A22. http:www.nytimes.com20141130uswhere-grass-is-

    greener-a-push-to-share-droughts-burden.html.

    [10] 1英亩≈4046.86平方米。

    [11] http:www.flightsafety.org; http:www.cnbc.comid102301598.

    [12] 1英寸≈2.54厘米

    [13] For an initial temperature of 155 degrees Fahrenheit,the formula is f(t) = 80e–0.08t + 75.

    [14] Paul Bedard (June 22, 2010).Brian Lamb: C-SPAN now reaches 100 million homes.

    usnews.com. U.S. News World Report. Retrieved November 22, 2010.

    [15] Based on Huff, op. cit., p. 48.

    [16] https:www.cbo.govsitesdefaultfilescbofilesattachments49837-Casualties_Working

    Paper-2014-08.pdf.

    [17] http:www.census.govcompendiastatab2012tables12s0511.pdf.

    [18] http:www.cdc.govnchsfastatsdeaths.htm.

    [19] Based on an example from Huff, op. cit., p. 83.

    [20] I thank my student Alexandra Ghelerter for this example. Barnett, A. (1994). How numbers

    are tricking you. Retrieved from http:www.sandiego.edustatpagebarnett.htm.

    [21] This is Best’ s term.

    [22] Davidson, A. (2015). The economy’ s missing metrics. New York Times Sunday Magazine, p.

    MM18 (July 5,2015).

    [23] http:americasmarkets .usatoday.com20150702.wall-street-gets-what-it-wants-in-june-

    95

    jobs-count.

    [24] Schwartz, N. D. (2015). Jobless rate fell in June, with wages staying flat. New York Times, B1

    (July 3, 2015).

    [25] Stats from http:mlb.mlb.comstatssortable.jspelem=[object+ Object] tab_ level= child

    click_ text= Sortable + Player+ hitting game_ type=% 27R% 27 season= 2015 season_ type=

    ANY league_ code=% 27MLB% 27 sectionType= sp statType= hitting page=1 ts=

    1457286793822 playerType= QUALIFIER timeframe=.

    [26] http:www.cdc.govnchsfastatsleading-causes-of-death.htm.

    96

    第5章

    收集数字的方法

    统计数据中含有数字并不就一定意味着这些数字在收集方面也恰当

    无误。请回想一下,在本部分的开篇,我们曾提到,判断一项统计属实

    与否,还应当考虑统计者这个因素,因为统计的对象、方法等皆由统计

    者甄选和采用。在数字的收集过程中,经常会出现很多错误和偏见,而

    它们往往能够误导成千上万的人得出错误的统计结论。尽管我们绝大多

    数人都不可能参与到每项统计的数字收集过程之中,但是我们却可以轻

    松做到学着对它们进行批判性思考。

    我们可以使用很多方法来获取统计数据:查看记录(比如政府机

    构、医院或教堂里的出生和死亡记录),做调查研究和民意测验,通过

    观察(比如统计经过主街和第三街道拐角的电动车数量)或者利用推理

    (如果尿布的销量上升,那么婴儿出生率极有可能提高)。在使用上述

    方法获取统计数据的任何一个阶段,偏见、误差和无心之过都有可能随

    时产生。提出“我们真的能够知道吗”和“我们怎样知道”这样的问题,本

    身也是我们在评估表述时需要做的一部分工作。

    抽取样本

    天体地质学家只采集月球上的岩石标本,不会去检测月球上的所有

    岩石。为了弄清楚哪位候选人在得票数方面领先,研究人员不会与每位

    选民交谈。为了了解病人在接受医生诊治之前需要在候诊室里等待多长

    时间,研究人员也不会统计记录每一位进入急诊室的病人的等待时间。

    假如那样做,要么不切实际,要么成本太高。相反,研究人员使用抽取

    97

    样本的方法来对真实的数字做出估计。当抽样比较合理时,这些估计就

    会极其准确。在公共民意测验中,为了对美国全国范围内人们(大约

    2.34亿名年龄超过21岁的成年人)如何看待某件事情做出估计,我们只

    需要采访1067个人即可。为了准确地了解某个器官的癌症发病率,我们

    只需要抽取该器官不到千分之一的样本,然后做活组织切片检查就行。

    统计样本一定要具有代表性。在你研究的统计群组中,如果每个人

    或物被选为样本的可能性都相等,那么你的样本就具有代表性。否则,样本就存在偏差。如果器官的某一部分发生了癌变,而你在抽取样本时

    却选择了错误的部分,那就无法诊断癌症。如果器官上只有很小的一部

    分发生了癌变,你在该处抽取了15个样本,你也许就会得出整个器官发

    生癌变的结论,真实情况却并非如此。

    就活组织切片检查或公共民意测验来说,我们并不总是能够提前知

    道统计群组中存在多少个差异性。如果在整个人群中每人都相同,那么

    我们就只需要抽取他们中的一个作为样本。假如我们面对的是一群基因

    完全相同的人,每个人的个性和生活经验也完全一样,那么只需要分析

    其中一个人的情况,就可以得到我们想知道的关于所有人的任何情况。

    但是,每个群组都会包含一些差异性,群组各成员之间也存在一定的差

    异,所以我们需要对自己的抽样方法保持谨慎态度,以确保我们能够获

    取所有重要的差异(并非所有的差异都重要)。例如,如果不让某人呼

    吸氧气,我们知道这个人必定会死去。在这一点上,整个人类都不存在

    差异(尽管在没有氧气的情况下,人们能够存活的时间长短有差别)。

    但如果我想知道一个人能够卧推多少磅[1]

    的重量,那么变量的范围就很

    宽泛了——我就需要对一个由不同的人组成的巨大人群横截面进行计

    量,以获取一个范围和一个稳定的平均值。我会抽取体型大的人、体型

    小的人、肥胖的人、瘦小的人、男人、女人、儿童、健身的人和终日懒

    散的人、服用合成代谢类固醇的人以及滴酒不沾的人。此外,一些其他

    因素也很有可能是我们必须要考虑的。比如,在测试的前一天晚上,接

    受测试的人睡了多长时间,从他们最近一次吃东西到测试时经过了多长

    98

    时间,他们是怒气冲冲还是心平气和,等等。当然,还存在一些我们认

    为根本无关紧要的因素:魁北克圣·休伯特机场当天的空中交通指挥员

    是男性还是女性;亚伯丁市一家餐馆里的任意一位顾客是否得到了餐馆

    及时的招待服务。虽然这些因素有可能会影响我们做的其他统计计量

    (航空旅行业潜在的性别歧视,西北部餐 ......

您现在查看是摘要介绍页, 详见PDF附件(8862KB,285页)