这才是心理学:看穿伪心理学的本质.pdf
http://www.100md.com
2020年2月12日
第1页 |
第5页 |
第15页 |
第30页 |
第48页 |
第363页 |
参见附件(1821KB,458页)。
这才是心理学:看穿伪心理学的本质,这本书的作者是著名的心理学教授基思·坦诺维,书中的内容帮助你纠正对心理学的种种误解,让你知道什么才是正的心理学。
这才是心理学内容介绍
此书不仅适合于心理学专业的学生,有助于建立心理学研究必要的批判思维技能与意识,而其通俗易读也非适合所有对心理学感兴趣的读者,它将帮助你纠正对心理学的种种误解,学独立地估心理学,用科学的精神和方理解自己和他的行为。此外,由于心理学与其他学科的共通,《这才是心理学:看穿伪心理学的本质》也不失为本精彩有趣的科学哲学类读。
这才是心理学作者资料
基思·坦诺维
加拿多伦多学类展与应用心理学教授,曾担任加拿应用认知科学席科学。他的研究领域是阅读和推理的心理学制,迄今已表200多篇文,出版了7部著作。在项对于文引用率的调查,坦诺维位列引用率的50位展心理学之。坦诺维教授于2010年获得格威教育奖,并于2012年荣获心理学颁的桑代克终身就奖。
译者:
窦徽
北京师范学心理学博士、清华学心理学博士后,加州学伯克利分校心理学访问学者。现为央财经学社展学心理学副教授。研究领域为社心理学、经济心理学与积心理学。
刘肖岑
华师范学心理学博士、加拿英属哥伦比亚学与西蒙弗雷学访问学者、加学者。现为都师范学学前教育学副教授。研究领域为儿童展与教育、格与社心理学。
这才是心理学章节目录
Chapter1 心理学充满生机:在科学阵营里左右逢源
Chapter2 可证伪性:如何挫败头脑中的小精灵
Chapter3 操作主义和本质主义:“但是,博士,这到底是什么意思?”
Chapter4 见证和个案研究证据:安慰剂效应和了不起的兰迪
Chapter5 相关和因果:用“烤箱法”避孕
Chapter6 让一切置于控制之下:聪明汉斯的故事
Chapter7 不像是真实生活的心理学实验与“人为性”批评
Chapter8 避免爱因斯坦综合征:聚合性证据的重要性
Chapter9 打破“神奇子弹”的神话:多重原因的问题
Chapter10 人类认知的阿喀琉斯之距:概率推理
Chapter11 偶然性在心理学中扮演的角色
Chapter12 不招人待见的心理学
这才是心理学:看穿伪心理学的本质截图
书名:这才是心理学:看穿伪心理学的
本质
作者:(加)基思·斯坦诺维奇
本书由“行行”整理,如果你不知道读什
么书或者想获得更多免费电子书请加小
编微信或QQ:2338856113 小编也和结
交一些喜欢读书的朋友 或者关注小编个
人微信公众号名称:幸福的味道 id:
d716-716 为了方便书友朋友找书和看
书,小编自己做了一个电子书下载网
站,网站的名称为:周读 网址:
http:www.ireadweek.com目录
CONTENTS
序言
推荐序 心理学有什么不同之处
译者序
序言
Chapter 1 心理学充满生机:在科学阵营里左
右逢源
弗洛伊德问题
现代心理学的多样性
科学的统一性
那么,什么是科学
心理学和世俗智慧:“常识”的误区
心理学是一门年轻的科学
小结
Chapter 2 可证伪性:如何挫败头脑中的小精
灵
理论和可证伪性标准
科学中的错误:逼近真理
小结
Chapter 3 操作主义和本质主义:“但是,博
士,这到底是什么意思?”为什么科学家不是本质主义者
心理学领域的操作性定义
小结
Chapter 4 见证和个案研究证据:安慰剂效应
和了不起的兰迪
个案研究的地位
为什么见证叙述毫无价值:安慰剂效应
“鲜活性”问题
见证为伪科学打开方便之门
小结
Chapter 5 相关和因果:用“烤箱法”避孕
第三变量问题:戈德伯格与糙皮病
方向性问题
选择性偏差
小结
Chapter 6 让一切置于控制之下:聪明汉斯的
故事
斯诺与霍乱
比较、控制和操纵
小结
Chapter 7 不像是真实生活的心理学实验与“人
为性”批评
为什么自然性并非总是必要的
心理学理论的应用
小结Chapter 8 避免爱因斯坦综合征:聚合性证据
的重要性
关联性原则
科学共识
不要对矛盾数据感到绝望
小结
Chapter 9 打破“神奇子弹”的神话:多重原因
的问题
交互作用
单一原因解释的诱惑
小结
Chapter 10 人类认知的阿喀琉斯之踵:概率推
理
“某某人”统计学
概率推理以及对心理学的误解
有关概率推理的心理学研究
小结
Chapter 11 偶然性在心理学中扮演的角色
试图解释偶然性事件的倾向
偶然性和心理学
接受错误以减少错误:临床预测与统计预
测
小结
Chapter 12 不招人待见的心理学
心理学的形象问题心理学和其他学科
我们是自己最坏的敌人
每个人不都是心理学家吗
抵制科学心理学的根本原因
结束语推荐序 心理学有什么不同之处
彭平凯 清华大学心理学系教授、系主任
心理学是一门很容易让人误解的学科。与其
他学科不同,它研究的是与人民生活紧密相关的
问题。有些还正好是大家都熟悉,而且经常关心
的问题。比如:什么样的人容易讨人喜欢?什么
样的事情我们记忆深刻?什么样的事情让人高兴
(或痛苦)?为什么男人比女人更爱聊政治时
事?人为什么要自杀?意念能不能被植入梦中?
等等……正因为大家关心这些问题,人们就会有
自己的分析,自己的证据,得出自己相信的结
论。很多时候,这些自觉的结论与心理学家的研
究结论并不完全一致,比如说,我们心理学家就
发现,青梅竹马的婚姻很难成立,婴儿并不是有
奶便认娘,性格并不决定一个人的命运,等
等……每当矛盾、怀疑、迷惑甚至气愤产生的时候,我们到底是该相信自己的直觉、经验和常识
呢,还是该相信心理学的研究、证据和知识呢?
不幸的是,大多数的心理学教科书只满足告
诉大家心理学的研究、发现和知识,但从不说明
为什么这些研究、发现和知识是值得我们关注和
信任的。这些书的作者好像都在假设每一位读者
思考起问题来都像心理学家一样,相信和理解心
理学的研究、发现和知识。幸运的是,基思·斯坦
诺维奇教授写了这本这本《这才是心理学》,一
本“与众不同的心理学”教科书。他总结了心理学
家的职业特质,让每一位读者都有机会去理解我
们心理学家是如何去思考、分析和解读人类的行
为和心理的。他的每一章都将一个常识的、朴素
的、直觉的有关人类心理的分析和思考与一个科
学的、严谨的、心理学的分析和思考相对比,以
帮助读者理解心理学家的分析逻辑和研究思路。
我个人觉得,在斯坦诺维奇阐述的心理学特
质中,有两点应该是区分我们心理学家和其他人
(包括其他领域的科学家)与众不同的地方。
其一是我们心理学的批判性思维习惯,也就
是说,心理学不相信个人的智慧,更相信科学的
方法,而科学方法的本质是证伪,即对我们的经
验、常识和直觉,产生怀疑、挑战和批评。从原则上而言,心理学家不怕犯错误,但害怕以假乱
真。心理学家也不相信那些能回答所有问题的绝
对真理,但相信对所有问题应该有一个相对正确
的答案。心理学家从不相信个案和例子,因为其
随机性和主观性太过明显,但我们愿意相信大样
本基础上的科学研究发现。我们希望听到动听的
心理故事,但更愿意看到众多心理学观察的数据
和总结。
其二是我们心理学的概率性思维习惯。我们
和很多自然科学家思考方式不同之处就在于我们
更容易相信,任何人类的行为都是概率性的表
现,也就是说,它有一定的不确定性,会受到其
他随机事件的影响。其实人类很多学科都是建立
在概率基础之上的,比如说核物理、天体物理、生物进化、病理学、所有的社会科学(经济学、社会学、政治学等)等等,它们都不可能准确预
测每一个研究对象的具体活动,但都对整体的事
物活动规律有很好的描述和预测。只不过我们心
理学家更愿意承认而且强调我们学科的不确定性
而已。
总之,我很高兴地看到这本书在中国再版。
杨中芳老师的早期译本是我很喜欢向心理学爱好
者推荐的一本心理学教科书。而新版的译本,尤
其令我兴奋,因为它是由我欣赏的两位年轻同事——东徽和肖岑,下工夫,花时间,认真翻译完
成的。两位既是同行,也是夫妻,应该是我们心
理学界不鲜见的学术伴侣之一。这可能也是我们
心理学界与众不同的地方吧。译者序
此刻诸位手中拿的正是斯坦诺维奇教授的
《这才是心理学:看穿伪心理学的本质》(How
to think straight about psychology)第10版中译本。
记得我的博士后合作导师、清华大学心理学系主
任、加州大学伯克利分校终身教授彭凯平老师曾
经说过:在美国,如果一本心理学教科书能够再
版3次以上,这本书就堪称经典教材了。按照这
一标准,斯坦诺维奇教授这本书堪称经典教材中
的翘楚,无怪乎能够成为诸多国家高校心理学本
科专业学习的指定书目。
斯坦诺维奇教授曾感慨,写作最新一版的初
衷,与写第一版时无异。此感慨中有不忘初心方
得始终的赤子情怀,但也有些许的无奈:心理学
被大众误解的状况多年来并未有实质性的转变,心理学这些年的蓬勃发展也没有使这一情况有根本性的好转。对于这一点,相信每一位学习和从
事心理学的人都有所体会。
时至今日,每个学心理学专业或从事心理学
工作的人仍然会被人问到三个问题,第一个通常
是:“你知道我现在心里在想什么吗?”名列榜眼
的问题则是:“你会催眠和解梦吗?”排名第三的
问题则一般是:“什么,你们心理学还做实
验?”这类对于问话人来说再正常不过的问题,却总能让这些学心理学的人哭笑不得。
一个真正称职的心理学工作者不应回避或敷
衍这类问题,正确的做法是直面它们并认真分析
其中的意义,给予人们正确的解答。从最常被问
到的这三个问题中,我们便能以管窥豹地看出公
众对于心理学的一些常见的误解和迷思。
第一个问题所揭示的事实是,心理学在大众
心目中被万能化了。所谓万能化,是指心理学研
究对象和功能的边界被无限地夸大了。首先,许
多人认为心理学无所不包,星座、属相、血型、玄学、人生哲理及各种心灵鸡汤都被认为是心理
学的范畴——实际上,心理学研究虽然涉及广泛
的人的客观行为和心理现象,但作为心理学的研
究对象必须满足“可检验”这一标准,超验的、超
感官的问题不在科学心理学的研究之列;另外,并不是说心理学不能研究血型、星座和超感知,实际情况是,这类现象和理论在历史上都曾经是
心理学的研究对象,但已被各种科学的方法所证
伪并从心理学的研究对象中剔除了出去。还有一
种观点认为,心理学是无所不能的,学了心理学
就能读心、能算命,甚至能千里之外控制他人的
大脑并操纵其行为,还兼具其他种种神奇的功
效。我们说心理学很神奇,是因为它能在一定程
度上解释心理现象和预测行为,并能提供一些行
之有效的干预方法,但是,科学心理学所有的预
测和解释都基于客观数据,所有的结论都具有概
率的性质,有一定的适用范围和条件,干预方案
也必须符合客观的心理和行为规律。因此没有能
够完美解释一切现象的心理学理论,也没有超出
人类经验以外的干预和应用。
第二个关于催眠的问题则揭示了另外一种对
于心理学常见的误解:心理学就是弗洛伊德的精
神分析,就是心理咨询。弗洛伊德这位伟大的心
理学家确实让后世的心理学研究者“既爱又恨”。
弗洛伊德的功绩在于,他以其非凡的工作投入和
严谨的思辨构筑了一套宏大、晦涩而让人着迷的
理论体系,开启了一片探索人类心灵世界的全新
领域,对社会文化、艺术创作产生了不可估量的
影响,并真正让世人开始了解和重视心理学;迄
今为止他的理论仍然广泛应用于心理治疗和干预的诸多领域。今天人们都能熟练用“焦虑”、“压
抑”、“潜意识”这些词来描述或解释分析自己的心
理状态,也是拜弗洛伊德和他的精神分析学派所
赐。说到心理学家,或许很多人不知道冯特和斯
金纳,但没有人会不知道弗洛伊德。然而,弗洛
伊德的盛名也带来了一系列问题,最主要的是两
点:一是他的光芒掩盖了其他领域心理学研究者
的工作和成就,二是弗洛伊德所构建的这些精巧
的理论很难用实证的方法加以验证,这也为后来
众多伪心理学和虚假治疗手段的滋生和发展留下
了一道后门。
最后一个问题也是最关键的——公众不了解
主流的科学心理学已经在实证主义的道路上行进
了很远。心理学是一门科学,必然要遵循科学的
标准,即研究的必须是实证可解的问题;方法上
要遵循系统的实证主义;研究结论是公开知识,即能够被重复验证(可再现性),并能经过同行
评议。这三条标准也是区分科学心理学和其他伪
心理学的分水岭。心理学的研究因此也与操作定
义、实验组和控制组、变量控制、数据统计等词
汇联系起来,而不是个人化的体验及感悟、头脑
风暴或纯粹的逻辑推导。
那么,是什么阻碍了公众了解和认知真正的
科学心理学?原因应该是多方面的。首先,对心理学的渴求使得大众对心理学产生了特殊的期
待。心理现象和心理问题与每个个体戚相关,人
们试图通过心理学解释这些问题和现象,并从中
获得行之有效的帮助和建议。在这方面,针对个
体的精神分析和治疗技术有一定的优势,但其他
大多数心理学研究则针对的是群体的普遍行为规
律,偏重于解释和预测,其研究结论都具有概率
性和领域特异性,因此无法有针对性地、面面俱
到地解决个体所有的心理问题。这有时难免会让
一部分抱着“求医问药”的心态来了解心理学的人
感到失望。此外,以“求医问药”为动机接触心理
学的人,也往往对心理学的其他领域缺乏关注。
第二,术语体系产生的阻隔。心理学作为一
门科学,为了让研究者之间形成共识并利于重复
验证,产生了一套严谨的术语体系,这一点和其
他科学学科并无二致。但不同的是,没有人会因
为不懂量子力学的各种晦涩的术语而鄙视物理
学,但他们却会因不能忍受心理学术语所造成的
隔膜而对科学心理学产生拒斥,继而转向了那些
通俗易懂但科学性无法得到保证的理论或方法。
究其原因,还是因为心理问题和现象与每个人的
关系太为紧密了,最近的需要总是要以最快捷的
方式介入和解决,这就构成了快速实用和科学研
究之间的一对矛盾。第三,心理学许多基础研究确实和大众生活
有一定的距离。在所有的科学门类中,基础研究
转化为实际应用需要时间,有的研究发现甚至要
几十年之后才能体现出其应用价值,心理学的基
础研究向应用的转化也概莫能外。这种滞后性有
时会让人产生一种科学心理学研究毫无意义的错
觉。
最后一个,也是非常重要的一个原因,就是
大众媒体在科学心理学的传播方面做得并不够
好。随着心理学的热度持续升温,许多电视、电
台、网站和出版商和纸媒也不断推出与心理学相
关的节目、书籍或专栏,但由于种种原因(如专
业限制、商业考虑等等),最终呈现在大众面前
并得到广泛传播的往往并不是科学的心理学,而
是包装精美的伪心理学;有一些所谓的“心理学
家”甚至在媒体平台上用错误的理论误导大众。
与之相对应的是,真正的心理学家和专业书籍无
人问津,而星座、血型、养生以及各种未经实证
检验的古怪疗法却打着心理学的旗号招摇过市,让心理学蒙受了许多质疑和指责。
基于以上种种,如何让公众了解真正科学的
心理学变得十分必要。市场上有关心理学的书籍
很多,但对象分化的情况也很突出:针对心理学
专业学生和心理学工作者的专业书籍能够提供很多有用的信息和知识,但有专业门槛的隐形限
制;而针对普通读者的非专业书籍相对通俗但在
信息质量方面良莠不齐。斯坦诺维奇教授所写的
这本《这才是心理学:看穿伪心理学的本质》的
定位则兼顾心理学的初学者和对心理学感兴趣的
更广大的读者群体,从质量来说应为此类心理学
入门读物中之翘楚。在这本20万字左右的书里,作者以生动而严谨的笔触告诉了读者什么才是真
正的心理学。书中重申了科学心理学诸多重要标
准和核心理念,澄清了有关心理学的种种误解和
迷思,有破有立,言之凿凿;理论讲述与精彩的
实验案例交相呼应,集科学性和趣味性于一体,十分耐读;有些犀利的论点足以对读者原有的知
识信念构成挑战,但这种不安很快就会被知识重
构的提升感和思辨的乐趣所取代。
这本书先前的版本曾经由杨中芳老师翻译,已使很多读者从中受益。从第8版开始到今天的
第10版,由我与刘肖岑老师共同翻译,对这3版
的翻译也让我们处于知识更新的喜悦中。书已近
付梓,但译者水平所限,难免有不周或纰缪之
处,还请广大读者给予指正。
本书第10版在第9 版的基础上有所更新,删
除了一些比较陈旧的文献和被最新的研究证明是
有争议的结论,同时补充了最新的研究结论和案例,反映了所涉领域最新的进展。此外,作者对
一些评述文字的说法和措辞进行了调整,使之更
切合所论述的主题。全新升级之后,这一版不仅
原汁原味地保留了之前版本的精髓,同时在内容
上更为丰富和具有时效性。
我们要感谢北京师范大学心理学院邹泓教
授,华东师范大学心理系桑标教授,美国加州大
学伯克利分校教授、清华大学心理学系教授彭凯
平,山东师范大学心理系张文新教授,首都师范
大学心理系方平教授,以及中央财经大学社会发
展学院辛自强教授,在本书翻译过程中给予的指
点和帮助,以及一直以来在学术和思想方面的引
导和教诲。同时,第10版的顺利出版,与人民大
学出版社各位编辑认真严谨的工作是分不开的,在此一并致谢。
要感谢的还有:中央财经大学的张杰、姜
涛、高霖宇、丁志宏、赵然、张红川、黄四林、翁学东、冯源、辛志勇、于泳红、孙铃、苑媛、张梅、侯佳伟、马敏、汪波、赵娜;首都师范大
学的王建平、李莉、田汉族、许晓晖、于开莲、高维华、严冷、刘昊、梁九清、黄翯青、夏婧、钱国英、周楠、孟繁华、丁锦红、郭春彦、王争
艳、王异芳、梁熙等诸位老师,以及我们的学生
陈婷、钱天月、张玉洁、杜宇、弓仲冬、谭洁、张惠、张缙、郭晓红、王娟和齐小琳。感谢你们
在本书翻译、出版过程中提供的各种帮助和支
持。
美国心理学会前任主席、积极心理学创始人
马丁·赛利格曼教授曾用一个、两个和三个词形容
心理学现在的状态,分别
是:“good”(好),“not good”(不好)和“not
good enough”(还不够好)。的确,心理学是一
门蓬勃发展的科学,当前虽然有不尽如人意的地
方,但我们坚信,伴随着每一位科学心理学工作
者的不懈努力,心理学必将变得更好,帮助人们
实现更大的福祉。心存此志,无远弗届。
窦东徽 刘肖岑序言
有这样一门尚不为大多数人所知晓的知识,它涉及人类行为和意识的不同形式,可以被用来
解释、预测和控制人类的行为。学习这门知识的
人能够更好地理解他人,对决定他人想法和行为
的原因有更加全面和精确的认识。
你可能想不到,这门不被知晓的知识就是心
理学。
当我说心理学仍不为人所知时意味着什么?
你一定认为此话不能当真。如今,书店里充斥着
大量标题为心理学的书籍,电视和广播脱口秀定
时播放关于心理学的主题,报纸和杂志也辟有心
理学专栏,怎么能说心理学无人知晓呢?但从某
种关键的意义上来讲,心理学确实仍是一个不为
人知的知识领域。尽管心理学似乎得到了众多媒体的关注,但
是心理学这个知识体系的绝大部分内容仍不为公
众所知。经由大众媒体传播的“心理学”知识在很
大程度上只是一种幻象。很多人不知道他们在书
店里看到的大部分所谓心理学书籍,都是由一些
在心理学界根本站不住脚的人写的;很多人也不
知道,多数在电视上号称心理学家的人,根本得
不到美国心理学会(American Psychological
Association, APA)和美国心理协会(Association
for Psychological Science, APS)的承认;他们更
不知道,大多数频频亮相的心理学“专家”,其实
对心理学领域的知识积累没有作出丝毫的贡献。
媒体这种对于“心理学”话题的浅薄关注,不
仅向公众传递了许多错误信息,还遮蔽了心理学
领域中真正的、不断发展的知识基础。公众不能
肯定到底哪些是心理学,哪些又不是,也不知道
该怎样独立对有关人类行为的主张作出判断。更
大的问题在于,很多人始终觊觎着那些要么缺乏
判断能力、要么认为无法对心理学主张作出判断
的公众。后一种观点有时被称为“无一定之规”的
态度,是本书要讨论的谬误之一,这种心态对社
会危害极大。公众不知道,关于行为的言论是可
以验证的,很多伪科学正是利用公众的这些无知
建立起百万美元的产业。人们并不知道许多伪科
学(例如占星术、通灵外科手术、超速阅读、生物节律、接触治疗、潜意识自助录音带、辅助沟
通和灵媒侦探等)所宣称的主张,其实早已被证
明是错误的。本书提到的这些伪科学产业的存
在,助长了媒体对伪科学进行炒作式报道的趋
势。这种趋势对心理学的危害远比对其他学科的
危害要大,理解个中缘由,是学习如何正视心理
学的一个重要环节。
本书面向的不是即将成为心理学的研究者,而是面向一个更大的读者群——心理信息的消费
者。本书的读者对象是心理学初学者,以及那些
在大众媒体上得知一些心理学话题、又想知道如
何去判断这些信息的合理性的广大读者们。
本书不是一本标准的心理学入门教材,它没
有对心理学领域已取得的研究成果进行总结。事
实上,单靠到大学里选修一门心理学导论的课
程,对于纠正公众心中已经被媒体误导了的对心
理学的看法来说,可能并不是终极的解决方案。
因为众多对心理学抱有很大兴趣的非专业人士没
有时间、没有钱或是没有机会进入大学进行正规
的学习。更重要的原因是,作为一名大学心理学
的教师,我不得不承认我和同事们在大学里教心
理学时,也总是没能引导初学者对心理学这门科
学产生一个正确的认识。原因在于初级的课程设
置中通常没有包含对批判性分析思维技巧的训练,而这正是本书讨论的焦点所在。作为教师,我们常常只会忙于 将“研究发现”塞入教学内容当
中。每次我们在和学生讨论到诸如媒体眼中的心
理学等稍微偏离教学大纲的话题时,都会感到有
些内疚,并开始担心自己会不会因为跑题而不能
在学期结束前完成所有授课内容。
现在的心理学导论类教科书通常都有
600~800页厚,并且引用了数百篇已经发表的文
献。当然,包含如此丰富的材料并没什么错,至
少它反映了心理学知识在不断增长。然而不幸的
是,负面效果也同时存在。教师们常常只忙于给
学生灌输一大堆的理论、事实和实验,而没时间
去关注那些会被学生带入心理学研究的基本问题
及错误观念。这主要是因为教师们(包括入门类
教科书的作者)想当然地认为,只要学生接触了
足够多的心理学研究,自然就能从中推导出问题
的答案。简而言之,他们希望学生可以从对心理
学各领域实证研究的讨论中,自行挖掘出各类问
题的隐含答案,但是这类希望往往都落空了。到
这门课的最后复习阶段或学期结束之前,教师们
才无比震惊和沮丧地发现,学生提出的一些问题
及说法,是他们在课程开始第一天就应该提出来
讨论的,而不是在14周之后。比如:“既然心理
学实验不同于现实生活,那么它们能告诉我们什
么呢”、“心理学能像化学那样成为一门真正的科学吗”、“可是,我在电视上听一位心理大师讲的
正好与我们教科书上说的相反”、“我认为这个理
论相当愚蠢,因为我弟弟的行为和这个理论所说
的截然相反”、“心理学不过是些常识”、“每个人
都知道什么是焦虑,何苦还要去定义它呢”、“心
理学不过是一堆观点而已”。对于很多学生来
说,仅靠思考书中的内容是无法为这些问题找到
答案的。在本书中,我将对这类问题和说法背后
的误区进行澄清。
不幸的是,研究发现,普通的心理学入门课
程并不能有效地纠正初学者对心理学所持的诸多
误解(Keith Beins, 2008; Kowalski Tayloer, 2009;
Standing Huber, 2003)。这一不幸的事实赋予了
本书以合理性。心理学学生需要批判思维方面的
正确指导,批判性思维能够使其对心理学信息作
出独立的评估。
即使若干年后学生们不再记得心理学入门课
程中的内容,但他们仍然可以运用本书所涉及的
基本原理去判断心理学的主张。即使埃里克森
(Erikson)的人生发展阶段论被忘得一干二净,他们也仍可以运用本书介绍的思维工具去辨别媒
体中出现的心理学信息的真伪。一旦掌握,这些
技能就可以成为终身受用的思维工具,帮助我们
去评判各种知识主张:首先,它将使我们能够对那些看似合理的事实做出一个初步和总体的判
断;其次,这些技巧提供了一些评估“专家”观点
可信度的标准。因为在复杂的社会中,人们对专
家观点依赖始终存在,在获取知识时,对专家观
点可信度的判断就变得尤为重要了。虽然这些批
判性思维技巧可运用于各个学科或知识门类,但
它们在心理学领域里尤其重要,因为此领域经常
被大众媒体所歪曲。
许多心理学家都对试图阻止心理学被歪曲的
努力持悲观态度。虽然这种悲观并非没有道理,但是这本类似“消费者指南”式的书源自一个信
念,那就是心理学家不能让这一问题成为一种自
我实现式的预言。
尽管我很高兴这本书能有多次再版的机会,但令人遗憾的是,本书存在的原因仍和本人当初
撰写本书第一版时完全一样。媒体对心理学的介
绍一如既往地是在误导大众,而学生在开始上心
理学入门课程时,还是带着与以往同样多的对于
心理学的误解。正因为如此,本书后续几个版本
的目标始终如前。这些目标也正在被越来越多心
理学教师所共享。斯坦福大学心理学家罗杰·夏佩
德(Roger Shepard)表达了与本书第一版写作初
衷相同的看法:“虽然大多数心理学的本科生或
许不会走上学术科研的道路,但我们仍然希望他们有能力去对那些不断出现在媒体上的片面、幼
稚、混乱及夸张的所谓社会科学‘发现’的报导作
出判断……那些广为流传、认为可以通过片面的
常识或更为糟糕的星相学之类的伪科学就能充分
理解人类行为和心理现象的谬论,势必向我们持
续发出挑战。”(Shepard, 1983, p.855)
批判性思维技能帮助人们更好地理解心理学
的主题,以及他们周围的世界所发生的事情。本
书将对此技能作一个简略的介绍。
第10版更新的内容
因为之前版本已经进行了章节重组,本书第
10版在结构上没有作很大的改动,各章节的内容
和顺序也保持原样。并且应评审者和读者的要
求,这一版与第9版篇幅相当。我更新和重写了
书中的许多例子(保留了读者反响最好的例
子),用最近的研究和主题替换掉了那些过时的
案例。本版最大的修订在于引用与本书所提及的
各种概念和实验相关的最新研究资料。因此,大
量新的引文出现在这一版中(确切来说是172条
新引文),读者可以获得有关样例和概念最新的
参考文献。本书一如既往会对批判性思维技能作简略介
绍,帮助学生更好地去理解心理学的主题。在过
去的15年里,大学里强调批判性思维技能的呼声
越来越高(Abrami et al., 2008; Sternberg, Roediger,Halpern,2006)。的确,美国一些州立大学系统
已经进行了以加强批判性思维教育为目的的课程
改革。与此同时,也有其他教育学学者认为,批
判性思维技能不应该脱离特定的学科内容。而
《这才是心理学》正好融合了这两种取向,在帮
助教师教授丰富的现代心理学知识的同时传授批
判性思维的技巧。
欢迎读者们将对本书的意见发送到以下邮
箱:Keith.stanovich@utoronto.ca.Chapter 1
心理学充满生机:在科学阵营里
左右逢源
弗洛伊德问题
在大街上随便拦住100个人,请他们说出一
个健在的或已故的心理学家的名字,然后记下他
们的答案。毫无疑问,他们提到的会是菲尔博士
(Dr. Phil)、韦恩·戴尔[1]
(Wayne Dyer)以及其
他一些“媒体心理学家”。如果我们把这类媒体和
通俗心理学家排除在外,只考虑那些对心理学作
出过卓著贡献的心理学家,那么这项非正式小调
查的结果就几乎没什么悬念了——西格蒙德·弗洛
伊德会名列榜首,B. F. 斯金纳可能会屈居次席,但得票数会远远落后于弗洛伊德。任何其他心理
学家都缺乏足够的知名度来撼动这两位的地位。
因此,可以说弗洛伊德和那些在媒体上频频露脸
的通俗心理学共同定义了公众心目中的心理学。
弗洛伊德的声名远播,极大地影响了普通公
众对心理学的理解,同时也造就了诸多认识上的
误区。例如,许多刚入门的心理学学生会惊讶地
发现,如果对美国心理学会(APA)会员中所有
认同弗洛伊德精神分析的人数进行一下统计,他
们的人数居然没有占到会员总数的10%。在另一
个主要的心理学组织美国心理协会(APS)中,这一比例也绝不会超过5%(Engel, 2008)。有一
本受欢迎的心理学入门教科书(Wade Tavris,2008),在其超过700多页的篇幅中,只有15页
内容提到弗洛伊德或精神分析学派,而且这15页
中经常出现的是对其的批判(“大多数弗洛伊德
的观点都曾经并且现在依旧被大多数实证取向的
心理学家排斥”,p.19)。
简而言之,现代心理学并没有像媒体和一些
人文学科那样被西格蒙德·弗洛伊德的理论所左
右,也没有被其限定。在现代心理学家所关注的
大量研究主题、数据和理论中,弗洛伊德的工作
只占其中极小的一部分,在这些研究和理论中占
更大比重的则是5位诺贝尔奖得主所做的工作:大卫·胡贝尔(David Hubel)、丹尼尔·卡尼曼
(Daniel Kahneman)、赫伯特·西蒙(Herbert
Simon)、罗杰·斯佩里(Roger Sperry)和托斯腾
·维瑟(Torsten Wiesel)以及美国国家科学基金的
前负责人理查德·阿特金森(Richard Atkinson)的
贡献。然而,这些人的名字对公众来说却相当陌
生。
弗洛伊德对于现代心理学的重要性被无限地
夸大了,这事儿已经足够糟糕了。更糟的是,弗
洛伊德的调查方法完全不能代表现代心理学家是
如何进行研究的。事实上,弗洛伊德式的研究方
法彻底误导了人们对心理学研究的印象。例如,弗洛伊德并不采用控制实验,而我们将在第6章
讲到,控制实验是现代心理学家“兵器库”中最有
力的武器。弗洛伊德认为,个案研究足以证明理
论的真实或谬误,在第4章中,我们将谈谈这一
理念为何是错误的。正如一位心理治疗领域的史
学家所说的那样,如果弗洛伊德本人是一名科学
家,那么他所宣扬的是一门很奇怪的科学……精
神分析包含理论和假设,但是缺少实证观测的方
法(Engel, 2008, p.17)。
最后,弗洛伊德的工作中最大的问题是理论
和研究数据的联系。正如我们将在第2章看到
的,对于一个科学理论来说,理论和研究数据的联系必须满足一些标准,而弗洛伊德的理论常常
不能满足这些标准(Dufresne, 2007; Engel,2008)。简而言之,弗洛伊德根据他得到的数据
(个案研究和内省)建立了一套精细的理论,而
这些数据并不足以支撑此理论;他专注于构建复
杂的理论构架,但并没有像许多现代心理学家那
样,保证这些理论建在可靠、可重复的因果关系
之上。总之,人们对于弗洛伊德式的工作太过熟
悉,这严重阻碍了他们对现代心理学的正确理
解。
在这一章中,我们将采用两种方法来解
决“弗洛伊德问题”:首先,当我们展示现代心理
学的多样性时,就能非常清楚地了解到弗洛伊德
的工作所占的比重其实是很小的;其次,我们将
讨论一下,在广泛而多样的心理学研究中,哪种
特征是最为普遍的。有关弗洛伊德工作的那种过
时的认识遮蔽了普通大众的双眼,使之无法看到
现代心理学所共有的唯一而普遍的特性:用科学
的方法去寻求对行为的理解。
注释
[1]这两位是活跃于美国媒体的所谓心理学家的代表,他
们这类人通常有着丰富的媒体经验,有广泛的受众,但他们
没有受过严格的学术训练,不被真正的心理学学术团体认可,所传播的往往是一些似是而非的心理学知识。——译者
注现代心理学的多样性
事实上,现代心理学包含了大量不同的内容
和观点。这种多样性使得作为一门学科的心理学
显得不那么浑然一体。美国心理学基金会杰出教
学奖得主亨利·格雷特曼(Henry Gleitman, 1981)
将心理学描述为“一个松散地联合在一起的学术
王国,它横跨了生物科学和社会科学两个领
域”(p. 774)。心理学圈以外的人批评这种多样
性。例如,人类学家克利福德·格尔茨(Clifford
Geertz, 2000)抱怨道:“至少从外部来看,心理
学不像是一个单一的领域,能够像通常那样被分
为学派和专业。它看起来像是不同的、不相关的
调查方法的大杂烩,这些调查之所以能够归为一
类,是因为它们都以这样或那样的方式探究所谓
心智功能。”(p.187)
心理学有着令人惊叹的广泛性和多样的调查
方法,知道这一点对于理解心理学的本质至关重
要。可以简单列举一些具体指标来证明这一点:美国心理学会(APA)有56个分支机构,每个分
支都代表了一个特定的研究或应用领域(见表1
—1)。从表1—1中,你可以看到心理学研究主
题、研究背景和研究方法的丰富性和多样性。另
一个大型心理学组织——美国心理协会(APS)
也同样分支众多。其实,表1—1对于心理学领域
的多样性的描述还是较为保守的,因为它给我们
造成了一种印象,即每个分支都是一个特定的专
业领域。事实上,56分支机构中的每一个都是非
常宽泛的研究领域,包含更小的不计其数的分
支。简而言之,要穷尽心理学领域主题的多样性
是非常困难的。
表1-1 美国心理学会(APA)的分支机构
1.普通心理学(General Psychology)
2.心理学教学(Teaching of Psychology)
3.实验心理学(Experimental Psychology)
5.评价、测量和统计(Evaluation,Measurement, and Statistics)6. 神经行为科学和比较心理学(Behavioral
Neuroscience and Comparative Psychology)
7.发展心理学(Developmental Psychology)
8.人格和社会心理学(Personality and Social
Psychology)
9.社会问题的心理学研究(Psychological
Study of Social Issues)
10.审美、创造力及艺术心理学(Psychology
of Aesthetics, Creativity, and the Arts)
11.临床心理学(Clinical Psychology)
12.应用咨询心理学(Consulting Psychology)
13.工业和组织心理学(Industrial and
Organizational Psychology)
14.教育心理学(Educational Psychology)
15.学校心理学(School Psychology)
16.理论咨询心理学(Counseling
Psychology)17.公共服务中的心理学家(Psychologists in
Public Service)
18.军事心理学(Military Psychology)
19.成人发展与老龄化(Adult Development
and Aging)
20.应用实验和工程心理学(Applied
Experimental and Engineering Psychology)
21.康复心理学(Rehabilitation Psychology)
22.消费者心理学(Consumer Psychology)
23.理论和哲学心理学(Theoretical and
Philosophical Psychology)
24.行为分析( Behavior Analysis)
25.心理学史(History of Psychology)
26.社区心理学(Community Psychology)
27.精神药理学和药物依赖
(Psychopharmacology and Substance Abuse)28.心理治疗(Psychotherapy)
29.心理催眠(Psychological Hypnosis)
30.国家心理学常务联合会(State
Psychological Association Affairs)
31.人本心理学(Humanistic Psychology)
32.智力缺陷和发展性障碍(Mental
Retardation and Developmenta Disabilities)
33.人口与环境心理学(Population and
Environmental Psychology)
34.女性心理学(Psychology of Women)
35.宗教心理学(Psychology of Religion)
36.儿童、青少年和家庭服务(Child, Youth,and Family Services)
37.健康心理学(Health Psychology)
38.心理分析(Psychoanalysis)
39.临床神经心理(ClinicalNeuropsychology)
40.心理学和法律(Psychology and Law)
41.独立从业的心理学者(Psycholigists in
Independent Practice)
42.家庭心理学(Family Psychology)
43. 男女同性恋及双性恋的心理学研究
(Psychological Study of Lesbian, Gay, and Bisexual
Issues)
44.少数民族的心理学研究(Psychological
Study of Ethnic Minority Issues)
45.媒体心理学(Media Psychology)
46.锻炼和运动心理学(Exercise and Sport
Psychology)
47.和平心理学(Peace Psychology)
48.团体心理学和团体治疗(Group
Psychology and Group Psychotherapy)
49.成瘾(Addictions)50.男性和男性化的心理学研究
(Psychological Study of Men and Masculinity)
51.国际心理学(International Psychology)
52. 临床儿童心理学和青少年心理学
(Clinical Child Psychology and Adolescent
Psychology)
53.幼儿心理学(Pediatric Psychology)
54.药物疗法(Pharmacotherapy)
55.创伤心理学(Trauma Psychology)
注:没有分支4和11。
多样性的含义
许多人学习心理学是希望能够学到一套宏大
的心理学理论,以此来概括和解释人类行为和意
识的方方面面。但这类愿望总是会落空,因为构
成心理学的不是一整套宏大的理论,而是许许多
多不同的理论,每个理论仅仅能够解释行为的有限方面(Griggs, Proctor, Bujak-Johnson, 2002)。
心理学的多样性使得理论整合变得极为困难。事
实上,在许多心理学者看来,“整合”本身就是“不
可能的任务”。尽管如此,另外一些心理学家却
正在寻求领域内的理论整合(Cacioppo, 2007a,2007b; Cleeremans, 2010; Gray, 2008; Henriques,2011; Sternberg, 2005)。例如,在过去的20年
间,心理学的学科统一性有所增强,这要归功于
进化心理学家的努力。这些研究者将人类心理过
程视为服务于某些重要进化功能(诸如亲缘关系
识别、择偶、合作、社会交换及后代抚养等)的
机制(Buss, 2005, 2011; Cartwright, 2008; Ellis
Bjorklund, 2005; Geary, 2005, 2008),并试图以此
来实现概念的整合。卡乔波(Cacioppo, 2007b)
同样也指出,像社会认知神经科学这样的分支,将心理学中的大量专业如认知心理学、社会心理
学和神经心理学紧密地联系在一起。
一些研究者认为心理学的多样性反映了学科
的潜在优势(Cacioppo, 2007a; Gray, 2008)。例
如,卡乔波(Cacioppo, 2007a)将心理学视为所
谓的“枢纽学科”——会对其他领域产生广泛影响
的学科。他引用证据表明,和其他科学相比,心
理学的发现有着更深远的影响。然而,无论心理
学家对心理学主题的统一性持何立场,他们都承
认,即便有一天能够实现理论的整合,其过程也是极为困难的。缺乏理论的整合为心理学招来了
一些批评,贬低了它作为科学所取得的进步。这
类批评源于一个错误的观念,即所有真正的科学
都必须具备一个宏大的、统一的理论。之所以说
它错误,是因为它忽视了其他科学同样也缺乏一
个完备统一的概念体系这个事实。哈佛大学心理
学家威廉·艾斯特斯(William Estes, 1979)已经
强调过这一点:
实验心理学家所面临的这种困境既不新
鲜,也非独有。20世纪早期,物理学在本科
水平的教学中便被分成了若干独立学科。因
此,我是通过分别学习力学、热力学、光
学、声学和电学而了解这门科学的。同样,化学也曾被分为无机化学、有机化学、物理
化学和生物化学。当时这些分支之间的交流
和融合并不比现在的心理学好到哪里去。它
们都仅仅在抽象的数学理论水平上才实现了
整合。医学也被分为众多分支,而且和心理
学一样,没有新的整合出现(pp. 661-
622)。
一旦我们知晓了决定某一门学科结构的社会
和历史因素是怎么回事,就能认识到,要求所有
领域具备高度统一性是不合逻辑的。事实上,许
多学者认为“心理学”这个暗示学科内容具有统一性的词汇并不能反映学科的特性。其结果就是,许多美国的知名大学的学院已经把它们的名字改
为心理科学学院(Department of Psychological
Sciences)(见Jaffe, 2011)。“科学”这一术语承
载了本章的两个重要信息:其一是多元化标志,即我们讨论过的这个学科内容的多样性的观点;
其二“科学”这一词汇也标志着,应该从方法而非
内容上去寻找心理学这门学科的统一性。只有这
样,我们才有望从不同研究者的研究目的中发现
更多的统一性。但即使是在方法领域,也依然存
在着有关这门学科的一些很深的误解。科学的统一性
仅说心理学是关于人类行为的科学,并不能
将它和其他学科区分开来。许多其他专业团体和
学科——包括经济学家、小说家、法律、社会
学、历史、政治科学、人类学和文学研究——都
或多或少与人类行为有关,心理学在这方面并非
独树一帜。
应用性也不能证明心理学具有任何独特性。
例如,许多大学生选择主修心理学是因为他们有
一个要帮助他人的崇高目标。但是在许多领域,如社会工作、教育、护理、职业咨询、物理治
疗、警事科学、人力资源以及语言矫正等,“帮
助他人”都是其中的重要组成部分。同样,培训
应用性的、通过咨询来帮助他人的专业人才并不
需要单独开辟一门叫做“心理学”的学科。
只有两点能证明心理学是一门独立的学科:
其一,心理学研究采用科学方法来探究人类及动
物的所有行为;其二,从这一知识衍生出的实际应用是具备科学基础的。如果不是这样,心理学
就失去存在的理由了。
心理学不同于其他行为研究领域的地方在
于,它试图向公众保证两点:第一,心理学中有
关行为的结论都有科学证据;第二,心理学的应
用都源于科学方法,并经过了科学方法的检验。
心理学是否曾经偏离过这两个目标呢?有过,而
且经常如此(Lilienfeld, 2007; Lilienfeld, Ruscio,Lynn, 2008)。本书就是关于怎样更好地实现这两
个目标的。在第12章中,我将回到这一主题——
一些心理学工作者因为不遵守适当的科学标准而
自我损害了其作为心理学家的合法性。但是,从
原则上讲,科学性正是保证心理学作为一门独立
学科的标准。如果有朝一日心理学不再追求这些
目标,即它不再愿意坚守科学标准,那它也就该
关张大吉,将其关注的领域拱手让给先前提到的
那些学科——因为此时它已成为了一个完全多余
的知识领域。
毫无疑问,任何人想要理解心理学,第一步
也是至关重要的一步,就是要意识到心理学的首
要特征——它是有关行为的、以数据为基础的科
学研究。对这一事实及其全部内涵的理解将贯穿
本书的始终,因为这是我们认识真正心理学的最
基本的途径。反过来说,人们之所以对心理学的理解会出现各种各样的偏差,正是因为未能意识
到它是一门科学的学问。例如,我们常常会听到
学术圈外的人宣称心理学不是科学。为什么还会
有这样的误解?
那些想让公众相信“心理学不能成为一门科
学”的企图,其产生的背景各不相同。正如我们
在后面的章节中所要讨论的,许多有关心理学的
错误认识,都是由那些伪心理学的代理人处心积
虑制造的。在我们的社会中,一个经营伪科学信
念系统的巨大产业正在兴起,这一信念系统出于
既得利益的考虑,总是想让大众相信,无论什么
都能纳入心理学的范畴,而且心理学的主张不能
以理性标准来衡量。这无疑为“催眠减肥”、“激发
潜在心灵能量”、“睡觉时学法语”这类广告以及利
润高达数百万的“心理自助”产业里其他诸多门道
的营销创造了绝佳的氛围。此类门道要么不是建
立在科学证据基础上,要么(在许多时候)与已
有的证据相冲突。
另一种对于科学心理学的排斥是由于一些人
不愿看到科学进入到长期以来由不容置疑的权威
或“常识”统治的领域里。历史上此类例子不胜枚
举——人们拒绝使用科学,而更喜欢利用哲学沉
思、神学谕告或世俗智慧去解释现实世界。每一
门科学都会经历过一个受到阻碍的阶段。与伽利略同时代的知识分子拒绝透过他的新望远镜观察
天空,因为“木星存在卫星”颠覆了他们的哲学和
神学信仰。几个世纪以来,人类解剖学的发展可
谓步履蹒跚,因为世俗和宗教禁止对人类尸体进
行解剖(基督徒认为,身体的内部是“上帝的辖
区”,见Grice, 2001)。查尔斯·达尔文总是受到
不断的抨击。保罗·布洛卡(Paul Broca)的人类
学协会(Society of Anthropology)在19世纪的法
国受到抵制,因为有人认为关于人类的知识会颠
覆国家。
关于人类的知识每向前迈进一步,都会引发
反抗。然而,当人们开始意识到科学并没有通过
调查和研究对人性造成亵渎,而是以扩展知识的
方式促进了人类的自我实现时,反抗终将烟消云
散。谁现在还认为星系图以及宇宙是由无数星球
所组成的复杂理论会摧毁我们对于宇宙的向往?
谁会选择禁止人体解剖时的医疗保健系统,并进
而拒绝从社区中获得的现代医疗保健?对于星球
和人类身体的实证性态度并没有磨灭人性。更近
的例子是,达尔文的进化论体系为遗传学和生物
学取得非凡的进步奠定了基础。但是,在我们更
接近人类的本质及起源的同时,残余的反抗势力
仍然存在。在美国,一些政客继续施压,意欲在
公立学校推行“神创论”教学;同时调查显示,有
很大比例的美国人(欧洲和加拿大人亦如此)并不接受“人类是经过自然选择进化而来的”这一科
学事实(Barnes, Keilholtz, Alberstadt, 2008;
Frazier, 2009, 2010; Laden, 2008)。进化生物学有
着无数辉煌的科学成就记录,时至今日还是照样
被公众所排斥。如此看来,心理学这门志在将所
有关于人类的固有信念都置于科学检验之下的新
兴科学,时下还会引发人们对其正确性的否定,这又有什么好奇怪的呢?那么,什么是科学
为了理解什么是心理学,我们必须理解什么
是科学。或许我们可以从“什么不是科学”入手。
按这种方法,我们能摒弃大部分常见的错误观
念。首先,科学并不是由内容来定义的。宇宙万
物的任何方面对于一门科学学科的发展来说,都
是一场公平的游戏,当然也包括人类行为的所有
方面。我们不能将宇宙万物分为“科学的”和“非科
学的”两类。尽管历史上始终有一股强大的力
量,试图将人类排除在科学研究的范围之外,但
正如我们所见,它们均以失败告终。拒绝将心理
学作为一门科学学科来对待,可能代表了这一历
史争论的余音。
科学也不能按照特定实验器材的使用来定
义。试管、电脑、电子设备或研究者的白大褂都
定义不了科学。这些都是科学的附属物而不是其
本质特征。科学是一种思考和观察事物以便深入
理解其运行机制的方法。在本章的剩余部分,我们将讨论科学的三个
相互关联的重要特征:(1)应用系统的实证主
义;(2)产生公共知识;(3)验证可解决的问
题。尽管我们将逐一检验每一条特征,但请记住
这三条特征构成了相互联系的统一整体(更多有
关科学的普遍特征的详细讨论,参见书后参考文
献部分列出的Bronowski、Cournaud、Medawar、Popper、Raymo以及Sagan的著作)。
系统的实证主义
如果在任何辞典中查找“实证主义”,你会发
现它的意思是“基于观察的实践”。科学家通过验
证来找寻世界的规律。这个事实可能对你来说是
显而易见的事实,而这正是过去两个世纪以来科
学态度传播的结果。在过去,它却不是显而易见
的。回想一下伽利略的例子,伽利略借助他那原
始的望远镜,宣称看见了环绕木星的一些卫星。
而在当时,有学识的人们都认为只存在七个“天
体”(五颗行星、太阳、月球)。长久以来,人
们认为获得知识的最佳途径是纯粹思考或诉诸权
威。一些同时代的学者甚至拒绝透过伽利略的望
远镜进行瞭望。还有一些人认为望远镜是设计用
来骗人的。更有一些人指责说望远镜是在地面上而非天空中工作(Shermer, 2011),另外一位叫
弗朗西斯科·西奇(Francesco Sizi)的学者试图驳
倒伽利略,但他并不是通过观察,而是通过下面
的一番话:
人的脑袋上有七个窗口:两个鼻孔,两
只耳朵,两只眼睛和一张嘴;因此在天界有
两颗吉星,两颗灾星,两颗发光星(指日
月),以及性状不明但无关紧要的水星。从
这点和其他无数相似的自然现象诸如七种金
属等中,我们就可以归纳出行星必然是七
个……除此之外,犹太人和其他古老的民
族,都将一周分为七天,并以七大行星来命
名;如果现在我们增加了行星的数目,将导
致整个系统的崩溃……进一步来说,卫星用
肉眼无法看到,因此对于地球没有影响,既
然没有用处,也就不存在(Holton
Roller, 1958, p. 160)。
关键问题不在于以上论述多么愚蠢可笑,而
在于它被视作可与真实观察抗衡的一种辩驳。今
天我们嘲笑它是因为我们都是事后诸葛亮。三个
世纪以来,业已证明力量的实证取向使我们强于
可怜的西奇。要是没有经历这些实证主义的岁
月,我们中的许多人可能都会点头同意并对他大
加褒奖。的确,实证取向并不一定显而易见,这就是为何即使在一个科学占统治地位的社会中,我们也不得不经常强调它的原因。
纯粹、单一的实证主义还不够。注意本小节
的标题是“系统的实证主义”。观察很好,而且很
有必要,但是对于自然世界单纯的、非结构化的
观察并不能导致科学知识的产生。假使你记录下
自己一天中从起床到睡觉之间观察到的所有情
况,完成这一任务时,你会拥有一大堆事实,但
仅凭此并不能让你更好地理解这个世界。科学观
察被称为“系统性的”,是因为它是结构化的,所
观察的结果能够揭示自然世界一些潜在的本质。
科学观察通常都是理论驱动的;它们检验有关世
界的各种不同解释观点。它们是结构化的,因此
可以根据观察结果,决定哪些理论得到支持而哪
些则被拒绝。
公共性的、可检验的知识:可重复性和
同行评审
从某种特殊意义上说,科学知识是公共性
的。当然,并不是说把科学发现张贴在社区中心
的公告牌上就叫“公共性”了。我们指的是这样一
个事实,即科学知识并不单独存在于特定个体的头脑之中。从某种重要意义上说,科学知识在没
有提交给科学团体、接受他人批评和验证之前,是根本不存在的。那些被认为隶属于特定个体思
维过程中、不可接受他人审查和批评的“特殊”知
识,永远都无法获得科学知识的地位。
科学通过可重复性来实现其公共可检验性的
理念。一项发现如果想在科学界获得公认,就必
须以一种能够让其他科学家尝试相同实验并获得
相同结果的方式呈现给科学团体。当这一切都完
成,我们就可以说,这一发现是可重复的。科学
家利用可重复性来定义公共知识。可重复性保证
了特定发现并不是由于个别调查者的错误或偏差
而产生的。简而言之,一项发现如果想要被科学
团体所接受,它必须能够被原始调查者以外的其
他人所重复。当一项发现以这种方式被呈现出来
时,它就成为了公共性的。它不再仅仅为原始研
究者个人所有,它还能够被其他人获取、扩展、批评,或以他们的方式得到应用。
诗人约翰·唐尼(John Donne)告诉我们“任
何人都不是一座孤岛”。在科学中,没有一个研
究者是一座孤岛。每个研究者都与科学团体及其
知识基础相联系。正是这种相互联系使得科学累
积性地发展。研究者不断在原有知识的基础上进
行新的探索,力求超越已知。而这一过程的前提便是,先前的知识以一种适当的方式予以陈述,使任何研究者都能以之为基础来进行探索。
公共性的、可检验的知识,指的是我们可以
将研究发现递交给科学团体,团体中的任何人都
能对其进行重复检验、批评或拓展。这个标准不
仅对于科学家,同时对于作为消费者的外行人来
说也是最重要的,因为他们必须对来自媒体的科
学信息进行评估。正如我们将在第12章所看到
的,区分大搞伪科学的江湖术士和真正的科学家
最主要的一个方法就是,前者常常避开科学出版
的常规渠道,而选择直接通过媒体公开他们
的“发现”。当公众面对真实性可疑的科学发现
时,一个屡试不爽、颠扑不破的标准就是,考察
这些发现是否在得到认可的科学期刊上发表过以
及是否经过了同行评审。对这一问题的回答往往
能够区分“李鬼”和“李逵”。同行评审是指每一篇
投到研究性期刊的文章都要经过数位科学家的评
审,并将批评意见提交给编辑(通常都是此期刊
所覆盖的某一领域中有资深研究经历的专家),再由编辑权衡这些意见,确定这篇文章可以立即
发表,还是需进一步实验研究和统计分析之后再
发表,或是因为有缺陷或价值太低而拒绝接受。
大多数期刊在每期中都刊有编辑条例说明,因此
很容易知道此期刊是否经过同行评审。并非所有经过同行评审的科学期刊中的信息
都必然正确,但至少它已满足了同行批评和监督
的标准。同行评审是一个最低标准,而非严格的
标准,因为大多数学科领域中都会有几十种质量
参差不齐的期刊。大部分科学观点在满足一些基
本标准的前提下,都可以在某些地方以正规的方
式出版。那种认为只有很小部分的数据和理论才
能够在科学界获得出版的观点是错误的。当一些
心理救助或治疗方面的江湖术士试图说服媒体和
公众时,往往会暗示,一种所谓“正统科学”的阴
谋将他们排除在科学出版渠道之外。但是,稍微
想一想,心理学领域中有多少这样的合法渠道
啊!APA的数据库 《心理学文摘》(PsycINFO)
收录了来自2000种不同期刊的文献,其中大部分
期刊都有同行评审。几乎所有待检验的理论和实
验都能在如此众多的出版物中找到自己的发表渠
道。
再次强调,我不认为所有发表在具有同行评
审机制的期刊上的所有观点都必然正确。相反,正如我先前所强调的,发表只是一个最低的标
准。然而关键在于,任何一种理念、一个理论、一项主张或疗法如果不能在有同行评审的学科文
献中获得适当的收录,问题就很明显了。尤其是
当某一主张缺乏证据却伴随着媒体的宣传活动
时,此理念、理论或疗法显然是骗人的。例如,2005年美国宾夕法尼亚州有一桩著名的诉讼,有
人试图在学校的生物课上教授神创论,鼓吹智力
设计(神创论的一种形式)理念的一个证人说,他很难举出任何一个经过同行评审的有关智力设
计的研究,尽管这一运动已经兴起了十年有余
(Talbot, 2005, p.68)。
同行评审机制在不同学科之间有所区别,但
是根本理念是相同的。同行评审是科学将客观性
和公开评议标准制度化的一种方法(另一种是重
复验证)。观点和实验要提交给其他评估,经过
一个仔细推敲的过程。只有通过这一严格过程的
观点才算符合了公共验证的标准。同行评审程序
绝非完美,但它对我们消费者来说是唯一的保护
机制。忽略它就等于让我们自己被巨大的伪科学
产业玩弄于股掌之间,而这一产业又极其善于操
纵媒体来达到自己的目的(见第12章)。在随后
的章节中,我们将更详尽地讨论,如果忽视这些
心理科学实践中固有的审查与制衡,我们将要付
出多么高昂的代价。
实证可解的问题:科学家对于可检验理
论的研究科学针对的是可解决的、明确具体的问题。
这意味着就其类型来说,科学家们所致力解决的
问题是能通过现有的经验技术获得答案的。如果
在当前所掌握的经验技术条件下,问题无解或理
论不可验证,科学家们将不会对它展开研究。例
如,“在日托期间,给予结构化语言刺激的3岁儿
童,与那些没有给予这些额外刺激的儿童相比,是否可以更早地做好接受阅读指导的准备”就是
一个科学问题,因为在现有的经验方法之下,这
是一个可解的问题。“人性本善还是本恶”就不是
一个可实证的问题,因此不属于科学领域。“生
命的意义是什么”同样也不是实证问题,因此也
不属于科学领域。
科学通过以下方式得以进步:提出理论解释
世界中的特定现象,根据这些理论作出预测,实
证地检验这些假设,基于检验的结果对理论进行
修正,通常次序为:理论→预测→检验→修正。
因此对于科学家来说,“可解问题”这个词的意义
通常是“可验证的理论”。什么样的理论才算是“可
验证”的呢?这一理论必须与真实世界中可观察
的事件具有特定的关联;这就是“实证可检验”的
含义。可检验性标准在学术上通常被称为“可证
伪标准”,这也是本书第2章的主题。
我们说科学家解决实证可解问题,并不是说在不同类别的问题中,有的本质上是可以解决
的,而有的则注定无法解决,并且这种区分是固
定不变的。恰恰相反,有些当前无法解决的问
题,在理论和经验技术更加进步的时候会成为可
解的。例如,20年前,对于“托马斯·杰斐逊是否
与其奴隶萨丽·海明斯生下了她的某个孩子”这一
争议话题,不会有历史学家认为它是一个实证可
解的问题。然而到了1998年,由于基因技术的进
步,这个问题已成为可解的,发表在《自然》
(Nature)杂志的一篇文章(Foster et al., 1998)
指出,杰斐逊极可能是埃斯顿·海明斯·杰斐逊的
父亲。
这就是科学得以发展而新的科学得以诞生的
方式。但对于“当前什么是可解的”这一问题,总
是存在巨大分歧。因为涉及特定问题时,科学家
们自己在这点上的意见都难以统一。因此,尽管
所有科学家都认同可解性标准,但是他们对其特
定应用可能存在不同的意见。诺贝尔文学奖得主
彼得·密达沃(Peter Medawar)就曾把他的一本
书定名为《可解的艺术》(The Art of the Soluble,1967),并在书中指出,科学的一部分创造力就
在于寻找处于人类知识最前沿、并可以用实证技
术加以解决的问题。
心理学本身就提供了许多从无解到可解的好例子。有许多问题,诸如“一个孩子如何获得其
父母的语言”、“为什么我们会忘记我们曾经知道
的事情”、“身处一个群体中会如何改变一个人的
行为和思想呢”等,在人们意识到可以以实证的
方法来解答之前的几个世纪里,都只能被猜想而
已。随着这一认识的慢慢发展,心理学逐渐集合
了来自各个领域中关于行为的各种问题。心理学
科逐渐脱离哲学,并成为了一门独立的实证科
学。
认知心理学家史蒂芬·平克(Stephen Pinker,1997)讨论了“未知”可以划分为“问题”或“玄
谜”。如果是“问题”,我们知道其答案是能找到
的,即使我们目前还没有答案,我们也知道它大
概是什么样子。如果是“玄谜”,我们甚至不能想
象答案可能会是什么样子。利用这些术语,我们
可以看到,科学就是将玄谜变为问题的过程。事
实上,平克(1997)指出,他之所以要写《思维
的运作》(How the Mind Works)这本书,正是
因为“从心理表象到浪漫的爱情,几十个心理和
思维方面的玄谜最近已经升级为问题了”(p.
9)。心理学和世俗智慧:“常识”的误
区
我们每个人都有一套内隐的有关行为的模
型,这些模型影响着我们的互动以及我们如何看
待自己和他人。事实上,一些社会、人格和认知
心理学家正在探究这些内隐的心理学理论的本
质。我们很少会清晰并有逻辑地表达我们的理
论。相反,我们通常只有在特意关注它们,或者
发现它们正遭遇某种挑战时,才会意识到其存
在。其实,我们个人的行为模型并不像真正的理
论那样具有内部一致性。相反,当我们觉得需要
对行为作出解释时,往往搬出一箩筐关于人类行
为的普遍真理、说教及谚语。这些关于行为的常
识存在一个问题,它们之中有不少是自相矛盾
的,因此也是不可证伪的(证伪原则是第2章的
主题)。
人们爱用一些民间谚语来解释行为事件,即
使之前在解释同一类型的事件时曾用过与之完全矛盾的谚语。例如,我们中的大多数人都听到或
说过“三思而后行”——若不是我依稀记得之前有
人告诫说“该出手时就出手”,我还会觉得这是个
有用的、直接的行为建议呢!“小别胜新婚”明确
预测了一种对于事件的情绪反应,但“眼不见,心不烦”不也同样如此吗?如果“欲速则不达”,那
为什么有时我们又听到“时不我待”?既然“三个臭
皮匠,顶个诸葛亮”,为什么又说“三个和尚没水
吃”?如果我认为“行走江湖,安全第一”,为什么
也相信“不入虎穴,焉得虎子”?如果“异性相
吸”,为什么又“物以类聚”?我劝许多学生“今日
事今日毕”,但我希望没跟我刚刚指导过的那个
学生说过这番话,因为我刚还跟他说“要顺其自
然”。这类谚语和俗话构成了对行为的固有“解
释”,人们爱用它们,就是因为它们难以驳倒。
不管发生什么事,可以拿一条出来解释一番。难
怪我们都认为自己是判断他人行为和人格的高
手。天底下发生的事我们都能解释。世俗智慧的
可鄙之处就在于,它们压根不承担被驳倒的风
险。
世俗智慧属于“后见之明”的智慧,并且它在
真正预测性的意义上是无用的,这也就是为什么
邓肯·沃茨(Duncan Watts)将他的一本书命名为
《一切都显而易见:一旦你知道了答案》
(Everything Is Obvious: Once You Know theAnswer)(2011)。沃茨论述了拉扎斯菲尔德
(Lazarsfeld)的一篇经典文章(1949),60多年
之前,拉扎斯菲尔德在应对“社会科学不能告诉
我们不知道的任何事情”这一普遍的批评时,他
列举了对600000名参加第二次世界大战的士兵进
行调查后得到的一系列发现,例如,农村背景的
士兵在服役期间比城市背景的士兵有更好的精神
风貌。人们可能会倾向于认为所有的这些调查结
果都显而易见。但是让我们以这个结果为例:人
们倾向于认为,显而易见,农村出来的人更加适
应严苛的物理环境,因此也肯定能更好地适应军
旅生活。其他类似的结果同样显而易见。接着拉
扎斯菲尔德使出了他的杀手锏:其实所有的发现
都与最初呈现的陈述观点完全相反。例如,事实
上,来自城市的士兵比来自农村的士兵在服役期
间有更好的精神面貌。最后一部分的内容是为了
让人们认识到,他们也能非常容易地对相反的结
果作出解释。如果一开始就被告知了真实的结
果,人们可能解释说他们认为城市的人已经习惯
了拥挤的环境和等级化的权威。人们可能永远也
不会意识到他们编造对相反的结果的解释是如此
容易。
所以说,有时我们内隐的心理理论不容反
驳。我们将在第2章中看到为什么这种不可反驳
性造成了理论的失效。然而,即使我们的世俗观念有一些特定用处,甚至是经验可证的,也会产
生问题。问题在于,心理学研究表明,在接受实
证检验后,许多关于行为的普遍文化信念都被证
明是错误的。
世俗观念(或称“常识”)出现谬误的例子俯
拾皆是。比如说,有一种说法是,学习好或读书
多的孩子都不擅长交际和体育。这个观点虽然错
得离谱,但在当今社会上极为流行。有大量证据
表明,与“常识”世俗观念正好相反,爱读书的人
和追求学术成就者与不读书者相比,有着更强健
的体魄,而且更常参与社交活动(Zill Winglee,1990)。再比如,学习成绩好的儿童比学习成绩
差的更容易被同伴接纳。读书多的人比不读书者
更愿意运动、慢跑、露营、远足、维修汽车等。
许多关于行为的世俗观念一经产生便生生不
息。例如,20世纪90年代风行于社会和学校的一
种世俗观念是,低自尊导致攻击行为。但实证研
究显示,攻击行为和低自尊并无关联
(Baumeister, Campbell, Krueger, V ohs, 2003,2005; Krueger, V ohs, Baumerster, 2008)。相
反,攻击行为似乎往往与高自尊相关同样。与之
相似,过去20年间有一个非常流行的假说认为,低自尊会导致学业不良的问题。事实上,自尊和
学业成绩之间的真实关系可能与教育工作者和家长的假设恰恰相反:是在校成绩(以及生活的其
他方面)的优秀导致了高自尊,而非后者引起了
前者。
考虑另一个常见的世俗观念——“孩子会给
父母带来幸福”。如果我们考虑退休后孩子会带
来的好处,这个陈述在一定程度上可能是对的。
人们回首往昔时,的确会发现孩子带来的幸福。
问题在于,人们常常混淆回忆的观点和对真实事
件的体验。从有孩子的例子看,两个观点是十分
不同的。在年老时,觉得有个孩子确实令人开
心。但是,就连续性、继时性的快乐(与追溯性
的回忆相反)来说,孩子实际上让人的快乐减
少。现在有一系列文献采用所谓“经验取样
法”(experience-sample)观察人们在不同时刻的
幸福程度(Brooks, 2008; Gilbert, 2006; Gorchoff,John, Helson, 2008; Lyubomirsky Boehm, 2010;
Wargo, 2007),研究发现了一系列的趋势,例如
结婚会增加幸福感。同时还发现,父母的幸福感
会随着第一个孩子的降生降低。当第一个孩子成
年时,幸福程度回弹一些,但随后又降低得更
多。只有当最小的孩子离家自立后,婚姻幸福感
才回归到没有孩子时的水平。
简言之,当世俗观念“孩子给父母带来幸
福”接受科学检验时,情况就变得复杂起来。只有从回溯性的角度看,当孩子终于离开家时,我
们可以品味将孩子抚养成人的成就感时,“孩子
带来幸福”才是正确的。但这与这个世俗观念通
常所表述的意思大相径庭。它通常指抚养孩子会
让你立刻或在近期感到幸福。这就是世俗观念的
惊人谬误之处。
世俗智慧是错误的另一个例子就是对学生来
说常见的劝诫:做多选题时,即使对所选答案感
到不确定,也千万不要更改最初的答案。不仅大
多数学生认为他们不应该更改不确定题目的答
案,而且《GRE巴朗指南》(Barron’s Guide to
GRE)也建议“当你决定更改答案时要极其谨
慎,经验表明更改答案的学生都会改
错”(Kruger, Wirtz, Miller, 2005, p.725)。这一
建议完全是错的,错误的原因是,世俗迷思有关
更改答案会降低一个人的分数的观点本身就大错
特错。实际研究表明,当对一个多选题的答案有
怀疑时,学生最好改变他们最初的选择(Kruger
et al., 2005; Lilienfeld, Lynn, Ruscio, Beyerstein,2010)。
世俗智慧大行其道的例子还有关于“我们只
用了10%的大脑功能”的世俗观念。虽然这一说法
完全缺乏认知神经的基础(Boyd, 2008; Lilienfeld
et al., 2010),但这一观念已流行了几十年,且俨然已成为所谓的“心理学公理”——即并不正
确,但是已经重复了无数遍,以至于普通人认为
就是事实的心理学观点。同样,一些人相信有些
人是“左脑型”,有些人是“右脑型”;或者说人格
的某些特定方面受左脑控制,另一些方面受右脑
控制。尽管现代神经科学研究确实显示大脑中的
一些功能专门化,但是对左右脑观点的这些通俗
化说法却是胡说八道,尤其是在发现我们的大脑
以联合的方式工作的情况下(Lilienfeld et al.,2010; Radford, 2011)。
世俗观念并不总对证据免疫。有时,当与之
矛盾的事实广为人知时,世俗心理学(“常识”)
也会改变。例如,几年前,一个广为流传的有关
儿童的俗语是“早熟者必早衰”(Fancher, 1985, p.
141)。这条俗语反映了“童年早熟与成年异常存
在关联”这一信念,这一信念得到了许多“小时了
了,大未必佳”的例子的支持。但在这件事上,心理学证据证明上述俗语并不准确,这一结论已
被大众文化所吸收,所以你以后几乎不大会再听
到这个世俗“智慧”了。
最后这个例子是一个警告,提醒我们注意当
下的“常识”,因为不难看出,昨日的常识往往变
成今天的谬论。毕竟,常识就是“尽人皆知的知
识”,对吧?对。那么,人人都知道妇女不能投票,对吧?非裔美国人不应该接受教育,对吧?
残障人士不该在社会里出现而应当被送到收容所
去,对吧?事实上,150年前,这些观念都是尽
人皆知的常识。当然,我们现在视这些过去的常
识为谬论,都是些以完全未经证实的假设为基础
的信念。但是,从这些例子中,我们可以看到心
理学在常识面前扮演的关键角色。常识总是基于
一些假设,而心理学对这些假设的经验基础进行
检验。正如我们之前看到的许多例子,有时候假
设得不到实证支持。这样的例子还有很多,通过
它们,我们可以看到,心理学扮演着一种世俗智
慧检验者的角色,常常难免和诸多根深蒂固的文
化信念发生冲突。心理学往往是“传递坏消息的
信使”[1]
,宣告原本为人们所接受的世俗观念再无
立足之地。这就不难理解,为什么许多人不仅无
视这些消息,还想消灭这些信使。
注释
[1]此处为“花剌子模信使”的典故,传说中亚古国花剌
子模有位国王,会奖赏带来好消息的信使,而处死带来坏消
息的信使。——译者注心理学是一门年轻的科学
建立在实证基础上的心理学始终存在反对意
见。仅仅100多年前,剑桥大学还拒绝建立一个
心理物理学实验室,因为这样的一个主题研
究,“以把人类的灵魂放在天平上的方式侮辱了
宗教信仰”(Hearst, 1979, p. 7)。心理学致力于
证明其问题是实证可解的,这一战斗也是最近才
取得胜利。不过随着科学的进步,心理学家将涉
足越来越多的主题,这些主题涉及人类某些牢固
的信念,而很多都是可以通过实证方法验证的。
心理学家现在正研究的话题性主题包括道德推理
的发展、浪漫之爱、种族偏见的性质以及宗教信
仰的心理和社会决定因素等。童年期性行为的研
究最近引发了很多争议(Lilienfeld, 2010; Rind,2008)。尽管有些人反对对这些领域进行实证调
查,但这些领域都取得了科学进展。
美国心理学会前任主席杰拉尔德·库彻
(Gerald Koocher, 2006)通过将他的一个首席专栏命名为“心理科学并不政治正确”来提醒我们有
关心理学性质的问题。在文章中,他讨论了一些
研究主题,例如肥胖的原因、决定政治态度的因
素、宗教和性行为的关系、家庭暴力等。他指出
这些标题下的研究结果都是有争议的,但是“心
理科学不能被社会自由派或保守派制定的政治正
确的标准所挟持”(p. 5)。
作为一门学科,心理学总是处于一种两难境
地:一方面,一些人反对把心理学称为科学,否
认心理学家可以建立关于行为的实证理论;另一
方面,另一些人则由于惧怕心理学在某些行为领
域揭示的真相会威胁到他们的信仰,而反对心理
学家在这些领域进行研究。斯金纳学派的心理学
家就总是面对这类相互矛盾的指责。例如,有批
评者认为行为主义的强化法则不适用于人类行
为。同时,另一些批评者则担心人们会运用这些
规律去对人类进行严酷的、不人道的控制。因
此,行为主义者腹背受敌,一些批评者否认行为
主义者所发现的行为定律有用,而另一些批评者
则害怕这些定律被滥用!
上述现象的产生主要是由于年轻的心理科学
刚刚开始揭示行为方面的一些事实,而在过去,这些问题总是游离于研究之外的。它的青涩多多
少少也解释了为什么许多人总是对这一学科产生误解。但无论如何,在过去的40年里,心理学已
经在我们称之为科学的这个相互关联的知识体系
中站稳了脚跟。认识不到这一点,就会对心理学
产生各种各样的误解。小结
心理学是一个主题非常广泛,但又相对松散
的学科,它包含一些通常不被归入同一概念的众
多研究主题。然而,它们都使用科学方法来理解
行为,从而实现了学科的统一。科学方法绝非是
指一套生硬的规则,而是指一些非常普遍的原
则。最重要的三点是:(1)科学采用系统的实
证主义的研究方法;(2)它以可公开验证的知
识为研究对象;(3)它研究实证可解的问题,并产生可检验的理论(第2章的主要内容)。构
成系统实证主义基础的结构化及可控制的观察是
本书随后几个章节的主题。科学通过同行评审等
程序和重复验证等机制来保证知识的公共性。
心理学是一门新兴的科学,因而经常会和世
俗智慧相冲突。这种冲突是任何新兴学科都会遇
到的,了解这种冲突有助于我们理解为什么有人
反对将心理学视为一门科学,并对心理学持敌意
态度。同时,与世俗常识之间的碰撞,也令心理学成为一门激动人心的学科。很多人进入这一领
域正是因为它提供了一个机会,让人们能够检验
那些被毫无争议地接受了数百年的“常识”。Chapter 2
可证伪性:如何挫败头脑中的小
精灵
1793年,一场严重的流行病——黄热病袭击
了费城。当时,这座城市里有一位顶尖的医生名
叫本杰明·拉什(Benjamin Rush),他是美国《独
立宣言》的签署人之一。在灾难过程中,拉什是
少数几位确实治疗了几千例黄热病的医生。拉什
信奉一种医学理论,认为黄热病必须用大量放血
的方法治疗(用手术刀或水蛭吸血的方法使血液
离开身体)。他为许多病人实施了这种疗法,当
他自己感染这种疾病的时候,他也如法炮制。评
论家指责他的治疗方法甚至比疾病本身更危险。
然而,随着疾病的流行,拉什对他的疗法却更加
自信了,即便曾有几个病人死去。这是为什么
呢?有人这么总结拉什的态度:“一方面坚信自
己的理论是正确的,另一方面又缺乏有效的方法
对治疗效果进行系统研究,因此他将每个好转的
病例都归为治疗方法的功效,而将每个死亡的病
例都归为病情的严重性。”(Eisenberg, 1977, p.
1106)换句话说,如果病人情况好转,就被作为
放血疗法有效的证据;如果病人死掉了,就被拉
什解释为病人已经病入膏肓,无药可救。我们现
在知道为什么对拉什的批评是正确的了:他的治
疗方法和黄热病本身一样危险。在本章中,我们
将要讨论拉什错在哪里。他的错误为阐明科学思
维中最重要的一项原则提供了样本,而这一原则
在评估心理学理论时尤其有用。
本章中,我们关注在第1章中已经讨论过的
科学的第三个基本特征:科学只研究可解的问
题。科学家们所说的“可解的问题”,通常是指可
检验的理论。科学家要确认某个理论是不是可检
验的,采取的方法就是确保该理论是可证伪的,也就是说,理论对应着自然世界中的真实事件。
接下来,我们就要看一看为何所谓的可证伪性标
准在心理学中如此重要。理论和可证伪性标准
本杰明·拉什在评估其疗法的效果时跌入了一
个致命的陷阱。他的评价方法根本就不可能让人
得出其治疗方法无效的结论。如果说,病人的恢
复是对他治疗方法有效性的肯定(对其医疗理论
的肯定),那只有当病人的死亡是对其治疗方法
的否定时才算公平。但事实上,他却把这种否定
合理化了。拉什解释证据的方式,违反了科学理
论建构和检验应遵循的最重要原则之一:他令自
己的理论不能被证伪。
科学理论的表述应该遵循这样的原则——从
中得出的预测有可能被表明是错误的。因此,对
某理论的新证据进行评价,必须使新的数据具有
证伪该理论的可能性。这项原则通常被称为“可
证伪性标准”。一位叫卡尔·波普尔(Karl
Popper)的哲学家一直致力于强调可证伪性标准
在科学进程中的重要作用,现在他的文章仍被从
事科研工作的科学家们广泛阅读。可证伪性标准主张,一项理论如果有用,它
所作出的预测必须是明确的,理论必须两面兼
顾,也可以说,这项理论在告诉我们哪些事情会
发生的同时,应该指出哪些事情不会发生。如果
不会发生的事情确实发生了,我们就得到了一个
明确的信号——这项理论有问题:它可能需要修
正,或者我们需要去寻找一个全新的理论。不管
哪种方式,我们将最终有一个更接近真理的理
论。相反,如果一项理论预测包括了所有可能观
察到的数据,那么它将永远不能被修正,同时我
们将被禁锢在当前的思维方式中,失去了取得进
步的可能。这就是说,一项成功的理论并不是可
以用来解释所有可能的结果,因为这样的理论本
身就丧失了任何预测能力。
在这本书的余下部分,我们会经常涉及理论
的评估,因此我们必须澄清一个关于理论的常见
误解。这个误解体现为我们常说的一句
话:“哦,这只不过是一种理论。”这句话代表了
外行人使用“理论”这个词时通常所指的意思:一
项未经证实的假设,一个纯粹的猜想或直觉。这
意味着一个理论与其他理论并无优劣之分。“理
论”这个词在科学上绝对不是这么用的。当科学
家说到“理论”的时候,他们指的不是未经验证的
猜想。科学上的理论是一组具有内在联系的概念,它们能对一组数据作出解释,并对未来实验的结
果作出预测。假设是从理论中产生的具体预测
(理论则更加普遍和全面)。目前可行的理论是
那些产生了一些假设,并且其中许多已经得到了
验证的理论。因此这种理论的理论结构与大量的
实证观察相一致。然而,当观察数据开始与理论
中提出的假说相矛盾的时候,科学家们会尝试构
建一个能为数据提供更好解释的新理论(或者在
更通常的情况下,只是修正已有的理论)。因
此,目前在科学范畴内所讨论的,都是在一定程
度上已经被证实了的、所作出的预测并没有与现
有的数据相矛盾的理论。它们并非纯粹的猜想和
直觉。
外行人和科学家们使用“理论”这个词时的这
种差异,经常会被一些试图将神创论纳入公立学
校教育的虔诚的正统基督教徒所利用(Miller,2008; Scott, 2005)。他们的论点通常是“进化论
毕竟只是理论”。这种观点试图借用外行人对“理
论”术语的用法,蓄意将理论歪曲为“只是一个猜
想”。然而,通过自然选择的进化理论不是外行
人所理解的“理论”(相反,在外行人的理解中,它应被称之为“事实”,见Randall, 2005),而是
一个科学意义上的理论,是由一系列庞大而多样
的数据支持的结论(Dawkins, 2010; Shermer,2006; Wilson, 2007)。它并不等同于其他任何猜
想,不是一个纯粹的猜测。相反,它与从属于其
他学科的知识密切相关,这些学科包括地质学、物理学、化学以及生物学的各个分支。著名的生
物学家西欧都萨斯·杜赞斯基(Theodosius
Dobzhansky, 1973)在他的一篇题为《生物学中除
了进化论以外,别无他物》(Nothing in Biology
Makes Sense Except in the Light of Evolution)的著
名文章里就阐述了这一观点。
敲门节奏理论
下面假设的例子展示了可证伪性标准是如何
起作用的。一个学生在敲我的门。跟我同一办公
室的同事有一套“不同的人以不同的节奏敲门”的
理论。在我开门之前,我的同事预言门后是一位
女性。我打开门,这个学生确实是女性。事后我
告诉同事,他的表现令我惊叹,但这种惊叹程度
非常有限,因为即使没有他所谓的“敲门节奏理
论”,他也有50%的正确几率——实际上这一概率
要更高一些,因为在大多数校园里,女性都比男
性多。他说他的预测能高于随机水平。另一个人
来敲门,我的同事预测说,这是个男性,而且不
到22岁。我打开门,果然是个男生,而且我知道他刚从中学毕业。我承认我有点被震撼了,因为
我所在的大学有相当数量的学生是大于22岁的。
当然,我仍然坚持说,校园里年轻的男性相当普
遍。见我如此难以被说服,我的同事提出做最后
一次测试。在下一个人敲门之后,我的同事预
测:女性,30岁,5英尺[1]
2英寸[2]
高,左手拿书
和挎包,用右手敲的门。打开门后,事实完全证
明了预测,对此我的反应截然不同了。我不得不
说,如果我的同事不是使用诡计事先安排这些人
出现在我门口的话,我现在的确非常震惊。
为什么我的反应会不同呢?为什么我同事的
三次预言会让我产生三种不同的从“那又怎么
样”到“太不可思议了”的反应?答案与预测的具体
性和精确性有关。越精确的预测在被证实的时候
会给我们越大的触动。要注意,不管怎样,精确
性的变化和可证伪性直接关联。预测越具体和精
确,有可能证伪它的观测现象就越多。例如,有
很多不是30岁和5英尺2英寸高的女性。请注意这
里暗含的信息:从我截然不同的反应可以看出,一个能够最大限度地将不可能发生的事件预测出
来的理论最容易令我折服。
好的理论作出的预测总是会显示自己是可证
伪的。坏的理论不会以这种方式把自己置于危险
的境地,它们作出的预测是如此笼统,以至于总会被证明是正确的(例如,下一个来敲我门的人
会是100岁以下),或者,这些预测会采用一种
能免于被证伪的措辞方式(如本杰明·拉什的例
子)。事实上,当一种理论被置于“不可被证
伪”的保护下,那么可以说它已经不再是科学
了。事实上,哲学家卡尔·波普尔正是由于试图界
定科学和非科学的区分标准,才会如此强调证伪
原则的重要性。这里的讨论和第1章中我们有关
弗洛伊德的讨论,甚至与心理学之间都有直接的
联系。
弗洛伊德与可证伪性
在20世纪最初的几十年,波普尔一直在探
寻,为何一些科学理论似乎导致知识的进步,而
其他一些则导致智力停滞(Hacohen, 2000)。例
如,爱因斯坦的广义相对论引发了一系列惊人的
发现(例如,从一个遥远的恒星发出的光线经过
太阳附近时发生弯曲),恰恰是因为它是这样建
构预测的:许多事件或现象一旦被证实与之相矛
盾,就可以证伪该理论。
波普尔指出,一些使知识停滞的理论却并非
如此,并以弗洛伊德的精神分析法作为例子。弗洛伊德的理论使用一个复杂的概念结构,在事后
解释人类行为,但并不作事前的预测。简而言
之,弗洛伊德的理论可以解释一切,但是波普尔
认为,也正是这个属性使得它在科学上毫无用
处。它不作具体的预测。精神分析理论的拥护者
花费大量的时间和精力试图用他们的理论解释人
类所有已知的活动——从个人的怪癖行为到广泛
的社会现象,但他们在使这个理论成功地成为事
后解释的丰厚资源时,也剥夺了其所有的科学实
用性。如今,弗洛伊德的精神分析理论在激发文
学想象力方面的作用比在当代心理学中扮演的角
色更重要。它在心理学中的地位日益下滑,部分
原因就是未能满足可证伪性标准(Wade Tavris,2008)。
这种不可证伪理论的存在会导致实际的危
害。例如,对于孤独症(部分基因紊乱所致的疾
病)成因的解释就曾被精神分析的解释带入了死
胡同。受到精神分析学派的影响,心理学家布鲁
诺·贝特海姆(Bruno Bettelheim)让“冰柜母亲”这
个如今已被证伪的概念在当时广为流传,认
为“造成婴儿时期孤独症的原因是父母不希望孩
子存在”(Offit, 2008, p.3)。像这样的观念不仅
有破坏作用,还阻碍了孤独症的研究。
作为另一个例子,回想一下抽动性秽语症的历史。这是一种以身体抽搐和痉挛为特征的紊
乱,并伴有言语症状,如嘟囔、吠叫、模仿言语
(无意识地重复他人的话)和秽语(强迫性重复
淫秽词语)。抽动性秽语症是一种器质性的中枢
神经系统紊乱,并已经成功地被药物治疗所攻克
(Scahill et al., 2006; Simth, Polloway, Patton,
Dowdy, 2008)。纵观历史,抽动性秽语症患者一
直遭受着迫害,早期被宗教统治者视为妖魔,近
代又被认为是鬼怪附体,要被强制驱魔(Hines,2003)。更重要的是,在1921至1955年之间,对
这种病的解释及疗法一直被精神分析学派的概念
体系所把持,这在很大程度上阻碍了人们对此病
成因及治疗的理解(见Kushner, 1999)。有关这
种病症的不可证伪的精神分析解释层出不穷。这
些似是而非的解释所造就的概念泥潭蒙蔽了这一
病症的实质,也阻碍了对其进一步的科学探究。
例如,有一位作者曾经这样写道:
(抽动性秽语症是)精神分析导致脑部
疾病研究发生倒退的典型例子。勒·图雷特
(La Tourette)将疾病归因于大脑的退行
性变化过程。而在20世纪最初的几十年,由
于弗洛伊德理论的盛行,对这种病的关注偏
离了大脑……这一倒退的结果使病人往往被
转到精神科医生(通常是精神分析学派的医
生)而非神经科医生那里,因此没有接受生理检查和研究(Thornton, 1986, p.
210)。
夏皮罗等人(Shapiro, Bruun, Sweet,1978)提到,一位精神分析师认为,他的病
人“不愿意放弃抽动,因为这成了她性快感的源
泉和潜意识性欲的表达”;另一位精神分析师则
认为抽搐“等同于手淫……与生殖器快感相联系
的力大多转移到了身体的其他部位”;第三位认
为抽搐是一种“肛门施虐的迁移症状”;第四位认
为,抽动性秽语症的患者具有“强迫型人格以及
自恋倾向”,病人的抽动“代表了一种情感症状,对想表达情感的压抑性防御”。
事实上,这类例子不胜枚举,在他们无知自
大的过度自信中尤为典型。发展心理学家杰罗姆·
卡根(Jerome Kagan, 2006)告诉我们:“弗洛伊
德的弟子桑德尔·费伦齐(Sandor Ferenczi),其
本人从未见过抽动性秽语症病人,但是却犯下了
同样严重的错误,他曾写过,抽动性秽语症病人
的频率性的面部抽搐是由于对手淫的压
抑。”(p.179)
夏皮罗等人(1978)对这类理论现状的总
结,很好地说明了忽视可证伪性标准的有害影
响:精神分析这种理论化的方式简直面面俱
到。抽搐是迁移性的症状而非歇斯底里症、肛门的而又是性欲的、受意志控制的而又是
强迫性的、器质性病变同时又与原始心理动
力有关……这些心理标签、诊断和治疗被不
幸而且是以一种毫不谦卑、相当武断、伤害
巨大的方式强加在病人及其家属身上。因为
其随后的广泛影响,这些观点为对此病症的
认识和诊治造成了极大的障碍(pp. 39-42,50, 63)。
当研究人员承认精神分析的“解释”对治疗该
疾病毫无用处的时候,对抽动性秽语症的认识和
治疗才开始获得进展。那些毫无用处的解释是诱
人的,因为它们似乎能对事情进行解释。事实
上,它们都是在事后对所有事情作出解释的。然
而,它们提供的解释不过是制造了理解的幻觉。
由于总试图在事后解释一切,它们也就堵死了前
进的大门。只有当一种理论并不预测所有事情,而是提出具体的预测——提前告诉我们哪个特定
的情形会出现时,该理论才会出现进步。当然,从这样的理论推导出的预测可能是错误的,但这
是优势,而非缺点。
小精灵如果人们能够从所研究的问题里跳出来,尤
其是人们若能以史为鉴(如本杰明·拉什的例子)
的话,就不难识别出那些不能证伪的概念体系。
当其例证明显是编造的时候,也很容易察觉其不
可证伪性。举例来说,大家还不知道,我已经发
现有一种大脑机制在控制行为,你很快就会在随
处可见的八卦杂志上看到这个发现。我发现在大
脑左半球的语言区附近住着两个小精灵,它们有
能力控制大脑许多区域中的电化学过程。而且,长话短说,它们基本上控制了一切事情。但是,有一个问题阻止我们看到它们,那就是小精灵有
能力发现任何对大脑的侵入(外科手术、X光
等),一旦觉察到外界的探测,它们就会消失
(我忘记说了,它们具备隐身能力)。
毫无疑问,我在这里是用一个更适合小学生
的例子来侮辱你的智慧。很明显,这个例子是我
捏造的,但我对小精灵的假设永远无法被证实是
错误的。不妨考虑一下。作为心理学导论的讲师
和公开演讲者,我经常被问到,为什么不讲授在
过去几年里在超感官知觉(extrasensong
perception, ESP)和通灵学方面取得的那些惊人
的新发现。我不得不告诉这些提问者,他们所获
悉的大多数相关信息,无疑都是来自于大众媒体,而非科学界所承认的信息来源。事实上,一
些科学家曾关注过这类说法,但没能够重复这些
发现。我要提醒各位读者,要将一个研究成果认
定为确定的科学事实,可重复性是至关重要的,尤其是当研究结果与以前的数据或现有的理论相
矛盾的时候。
我甚至可以坦率地说,许多科学家对ESP研
究已经失去了耐心。原因当然与此领域充斥着欺
诈、江湖骗术和媒体炒作的现象有关,但令科学
界觉醒的更重要的原因是马丁·加德纳(Martin
Gardner, 1972)所谓的“ESP研究的22条军规”。其
运作方式如下:一名“信奉者”(在开始调查之前
就相信ESP现象存在的人)声称已在实验室证明
了ESP。一名“怀疑者”(质疑ESP存在的人)被邀
请证实这种现象。通常,在观察实验情境之后,怀疑者会要求信奉者进行更多的控制(我们会在
第6章中讨论这种类型的控制),虽然这些要求
有时候会被拒绝,但通常善意的信奉者们会同意
他们的要求。当加入了实验控制之后,这种现象
就不再出现了(Farha, 2007; Kelly, 2005; Milton
Wiseman, 1999; Park, 2008;Wiseman, 2011)。怀疑
者会对这种失败作出正确的解释——早先对这个
现象的证实是由于缺乏足够的实验控制,因此结
论不能被接受。但他们往往吃惊地发现,信奉者
并不承认早先的证明是无效的。相反,他们搬出超感知的“22条军规”:他们坚称,心理能量是很
敏感的、微妙的,并极易受到影响。怀疑者
的“负面感应”是瓦解这一“超感官能量”的罪魁祸
首。信奉者认为,怀疑者的“负面气场”被移开
后,这种心理能量无疑将会回归。
这种对无法在实验室中证实ESP的解释方
式,在逻辑上与我编造的小精灵的故事相似。
ESP的运作就像小精灵一样。只要你不侵入性地
仔细观察它,它就在那儿。如果你观察它了,它
就不见了。如果我们接受这种解释,那么向怀疑
者证明这一现象就变得不再可能。这种现象只为
信奉者现身。当然,这种说法在科学领域是不能
接受的。我们没有磁力物理学家和非磁力物理学
家之分(即磁场只对前者存在)。以这种方式解
释ESP的实验,使得ESP的假设变得像小精灵的
假设一样不可证伪。正是这种解释方式,将ESP
排除在了科学殿堂之外。
不是所有的证实都等价
可证伪性原则对于我们如何看待一个理论的
证实过程具有重要的意义。许多人认为,一个好
的科学理论就是被多次证实的理论。他们假设,被实的次数是对理论进行评价的关键。但是,可
证伪性原则意指理论被证实的次数并不是最重要
的因素。原因在于,正如“敲门节奏理论”所展示
的那样,并不是所有的证实都是等价的。证实能
否令人信服,取决于预测在何种程度上将自己暴
露在可能被证伪的情境下。一个非常具体的、可
能被证伪的预测(例如,一位女士,30岁,5英
尺2英寸高,左手拿书和挎包,用右手敲门),比20个不可证伪的预测(例如,一个小于100岁
的人)拥有更强的说服力。
因此,我们不能仅关注理论被证实的数量,更要关注验证本身的质量。将可证伪性作为一种
评价标准,就可以使那些使用研究结果的人抵制
不科学的、全能理论的诱惑。这种全能理论会不
可避免地妨碍我们对世界和人类本质进行更深入
的探索。事实上,这种理论的死角也正是最魅惑
人的地方,因为它们永远不能被证伪。在纷繁多
变的现代世界中,这种理论千年不变。
波普尔经常指出:“这些(不可证伪的)理
论拥有巨大的心理吸引力,其秘密在于它们能够
解释一切事情。预先知道无论什么事情发生,你
都能理解它,不仅给你智力上的掌控感,而且,更重要的是,让你拥有应对这个世界所需的安全
感。”(Magee, 1985, p. 43)但是,这种安全感的获得并不是科学的目标,因为对这种安全感的追
求是以知识发展的停滞为代价的。科学是一套不
断挑战原有信念的机制,在这种机制里,原有信
念以一种能够被证伪的方式接受实证检验。这一
特点往往使科学(尤其是心理学)与所谓的世俗
智慧或者常识直接发生冲突(正如我们在第1章
中所讨论的)。
可证伪性和世俗智慧
心理学威胁到世俗智慧所提供的安逸感,因
为作为一门科学,它不能只提供无法被反驳的解
释。心理学的目标是对各种行为理论逐一进行实
证检验和筛选。某些世俗智慧表述得很清晰,经
得起实证检验,这当然是心理学所欢迎的,而且
其中许多已经被纳入了心理学理论。然而,心理
学并不追求那类事后能解释一切,但事先无法作
出任何预测的理论,不追求这种解释系统所带来
的安逸感。它不接受那些被设计得永不可变、并
代代相传的世俗智慧体系。试图向学生和公众隐
瞒这一点无疑是自毁长城。不幸的是,一些心理
学指导教师和普及者觉察到了心理学对世俗智慧
的威胁给一些人造成的困扰,于是他们有时会试
图通过传递错误信息来安抚这种情绪,如“你会学到一些有趣的东西,但别担心,心理学不会挑
战那些你深信不疑的观点”。这是一个错误,并
且会对“什么是科学”和“什么是心理学”造成混
乱。心理学建构了有关于性行为、智力、犯罪、经济行为及其他诸多人们感受强烈的主题。如果
对上述这些主题的调查没有发现一些令某些人感
到颠覆的事情,这才奇怪呢!
科学寻求概念上的变化。科学家试图描绘世
界的真实图景,而此图景可能与我们的固有信念
正好相反。现代思潮中有一种危险的趋向——认
为应避免让一般大众知道世界的真正本质,一种
无知的面纱是必要的,以防公众面对真相时手足
无措。心理学与其他科学一样,拒绝向人类隐瞒
真相。
此外,当我们被那些对人类行为有误解的人
们所包围的时候,大家都会蒙受损失。公众对于
教育、犯罪、健康、生产力、儿童福利和许多其
他重要问题的态度塑造了我们的世界。如果这些
态度源于错误的行为理论,那么我们大家都会受
到伤害。
承认错误的自由科学家们发现,可证伪性原则的一个最具解
放意义和最有用的启示是:在科学上,犯错并不
是罪过。哲学家丹尼尔·丹尼特(Daniel Dennett,1995)曾说过,科学的本质就是“在公众面前犯
错——在众目睽睽下犯错,以期他人能够帮助其
修正这些错误”(p. 380)。当数据与理论不符
时,通过对理论进行不断地修正,科学家们最终
共同构建起能更好地反映世界本质的理论。
事实上,如果我们能够在日常生活中使用可
证伪性原则的话,我们的生活品质将会大大改
善。这就是为什么我在本节的第一句话中使
用“具有解放意义”这个词的原因。它包含着一种
个人化的期许,即此处产生的理念能够同时对科
学之外的领域有所启示。如果我们能够理解这一
切,当我们的信仰与观察到的事实相冲突时,我
们最好是调整信仰,而不是否认事实和坚持错误
的想法,这样我们将会很少遇到一些个人和社会
问题。
当你与某人激烈地争论的时候——也许就是
当你给出一个有力的反击来捍卫你的观点的时候
——有多少次你会突然意识到你搞错了某个关键
事实或论据?这时你会怎么做?你会收回前面的
话,并向别人承认错误,同时承认别人的解释现
在看起来比你的更合理吗?或许不会。如果你和我们中的大多数人一样,那么你一定会采用“无
限合理化”的策略,即没完没了地寻找一些理由
为自己先前的错误辩解。你试图在不承认失败的
情况下使自己从争论中全身而退。你最不可能做
的就是承认自己错了。这样的话,你和争论对手
都会更加疑惑:到底哪一种信念更接近真理?如
果争论不能成为公共性的(如在科学中那样),如果正确和错误的信念以同样激烈的方式争辩,如果争论的结果不能得到正确的反馈(如本
例),那就没有更可靠的机制使信念与现实相吻
合了。这就是为什么那么多私人和公开的对话令
人困惑,为什么相比所谓的常识或世俗智慧,心
理科学在解释人类行为的原因方面更加可靠。
如果理解了我们的信念在历史上多么地因事
而异,可能就会发现我们在证据面前是多么容易
改变自己的信念。也就是说,信念的改变与否仅
仅取决于他们成长时在某地某时发生的事件的多
少。然而调查显示,大多数人对这种情况不够重
视。在我自己的实验室中,我们对设计来评定人
们鉴别信念的历史可变性的能力问卷中的数据进
行分析。以问卷中的一个项目为例,被试必须对
于“即使我周围环境(家庭、邻居、学校)与现
实情况不同,我也会有与现在相同的宗教思
想”这一陈述表达“非常、中等地或些许地同意或
者不同意”。宗教问题是信念随环境变化的典型案例(欧洲、美国人信奉基督教;非洲和中东人
信奉伊斯兰教;印度信奉印度教等)。虽然如
此,我和我的同事在几个调查中发现,大约40%
到55%的大学生会认为他们的宗教思想无论如何
也不会随着他们的历史环境(父母、国家、教
育)而改变。
证伪态度有益于科学本身的原因是,科学通
过排除不正确的假设而非集中精力研究完美的理
论而进步,这种态度在研究一个问题的初期尤为
重要。事实上,生活中诸多领域的情况都是如
此。通常定位最正确的表现方式是很困难的,但
是聚焦表现的错误却相对容易。评论家尼尔·波兹
曼(Neil Postman, 1988)指出,医生很难去定
义“完全健康”,但却很擅长发现疾病。同样,律
师能够轻易判断不公正,却很难定义“完全公
正”。证伪态度对于科学家来说很有用也正是基
于这一原因。尤其在研究问题的早期,研究的焦
点在什么是错误的——排除不正确的信念——对
科学家来说是很有成效的方法。
在科学过程中犯错是正常的,对于科学进步
来说,最大的危险在于我们人类极力避免将自己
的固有信念暴露在可能被证明是错误的环境中的
倾向,许多科学家已经意识到了这一观点的重要
性。科学家们必须避免这种倾向,诺贝尔奖得主彼得·米德瓦(Peter Medawar, 1979)认为科学家
应当牢记:一个假设在何种程度上被确信为正
确,实际上与其是否为真无关(p. 39; 原文为意
大利语)。
可以通过这样一种途径来理解米德瓦的话。
喜剧演员斯蒂芬·科尔伯特(Stephen Colbert)在
其2005年12月17号的表演中,创造了术语“感实
性”。感实性是指“内心感到真实,但是没有证据
支持”(Manjoo, 2008, p.189)。米德瓦说的意思
是,科学拒绝感实性。这常常使科学在现代社会
中成为异类,因为现代社会中,感实性比以往更
为普遍。
心理学界许多最具声望的科学家都遵循米德
瓦的建议——“一个假设在何种程度上被确信为
正确,实际上与其是否为真无关。”在一篇报道
实验心理学家罗伯特·克诺德(Robert Crowder)
职业生涯的文章中,引述了他的一位同事马扎林·
巴纳吉(Mahzarin Banaji)的话:“他是我认识的
最不维护自己理论的科学家。如果你发现一种方
法证明他的理论有漏洞,或者他的实验发现有局
限性或有缺陷,他会非常高兴,并会和你一起计
划如何推翻该理论。”(Azar, 1999, p. 18)艾泽
(Azar, 1999)描述了克诺德如何提出了一个叫
作“前分类听觉存储器”的记忆成分理论,然后又仔细地设计了一个实验研究证伪了自己的模型。
物理学家杰罗米·格鲁普曼(Jerome Groopman,2009)描述了证伪态度在医疗诊断中是多么实用
和有效:“所以医生学会去质疑他提取的病历数
据的有效性……最有启发性的时刻是你被证实是
错误的,并且意识到你相信自己知道的比实际的
多,其实是忽略了能够否认你的推诊或是未能考
虑到病人患有不止一种疾病的关键信
息。”(p.26)
早于达尔文数百年前,亚里士多德曾经说
过:“受过教育的标志是可以去思考一种思想,而不去接受它。”更有意思的是,经济学家约翰·
梅纳德·凯恩斯在经济大萧条期间阐明了证伪态
度,他批判亚里士多德道:“事实改变,我就会
改变我的观念。你能吗,先生?”(Malabre,1994, p.220)
但是,要让科学发挥作用,并不需要每位从
事科学工作的科学家都具备证伪的态度。科学那
种揭示世界真知的独特力量,并不产生于科学家
们独特的德行(即他们是完全客观的,他们在解
释研究结果时从来不带偏见等)。实际上,这种
力量的产生是因为会犯错的科学家们身处一个证
实与平衡的程序中。在这个程序中,总会有其他
科学家提出批评并发现他们同行的错误。哲学家丹尼尔·丹尼特提出过相同的论点:“不是每位科
学家都必须表现出罗伯特·克诺德的客观性。”丹
尼特强调“科学家和其他任何人一样容易犯错,但认识到他们及其所属团体的犯错根源之后,他
们设计出精巧的系统来约束自己,努力防止自身
弱点和偏见影响自己的研究结果。”(p. 42)心
理学家雷·尼克尔森(Ray Nickerson, 1998)以一
种更为幽默的方式道出了相同的观点:“科学家
们的虚荣心实际上在科学进程中起着作用,“科
学家对自己的想法抱有的批判性态度并没有在很
大程度上导致科学的成功……更真实的情况是,每个科学家都积极地想要证明某些科学家所持有
的观点是错误的。”(p. 42)科学知识的力量并
不是来自于科学家的德行,而是源于他们不断交
叉检验彼此的知识和结论的这一社会过程。
想法不值钱
先前关于检验世俗智慧的讨论,将我们引向
了可证伪性原则的另一个有趣推论:想法不值
钱。说得更准确些,我们的意思是某些类别的想
法不值钱。生物学家和科学作家史蒂芬·古尔德
(Stephen J. Gould, 1987)对此有所阐述:15年的月刊专栏写作生涯,让我收到各
个科学领域非专业读者的海量来信……我发
现一个常见的、同时是压倒性的错误观点。
人们会告诉我他们提出了一项革命性的理
论,它会拓展科学的边界。这些理论通常以
单倍行距打印在几张纸上,内容通常是对最
深层的终极问题的猜测——什么是生命的本
质?宇宙的起源?时间的起点?但是,这些
想法不值钱。任何智力正常的人都能在早饭
前想出几个这样的念头。科学家们自己也很
容易就能想出来。但我们不这样做(或者
说,我们只让它们留在自己脑子里),因为
我们不能找到方法来验证它们以决定它们的
对错。一个既不能被证实也不能被证伪的可
爱想法,对科学来说又有什么用呢?
古尔德对最后一个问题的回答是:“没
用。”古尔德这里所说的廉价想法正是我们早先
在对卡尔·波普尔观点的讨论中提到的那些:包罗
万象、复杂、“模糊”、能够用来解释一切的宏大
理论——这种理论的建构更多是为了提供情感支
持,因为它们没打算被改变或抛弃。古尔德告诉
我们,这种理论对于科学目标是无用的,无论它
们多么有抚慰功能。科学是创造性的过程,但是
这种创造性需要让概念结构符合实验数据。这并
不容易做到。那些如实解释真实世界的想法一点儿也不廉价。也许这就是为什么好的科学理论很
难提出、而不可证伪的伪科学信仰体系泛滥的原
因,因为后者很容易建构。
科学理论与世界紧密联系。它们是可证伪
的,并能作出明确具体的预测。事实上,形成真
实的、科学真正可以解释的理论是一项困难的任
务。但是,理解科学运作的一般逻辑并没有那么
困难。事实上,现在已经出版了大量专为儿童撰
写的关于科学思维逻辑的书籍(Binga, 2009;
Bower, 2009; Dawkings, 2012; Epstein, 2008;
Swanson, 2001, 2004)。
注释
[1]1英尺≈0.305米。——译者注
[2]1英寸=2.54厘米。——译者注科学中的错误:逼近真理
在解释可证伪性原则的过程中,我们已经勾
勒出科学进步的简单模式:提出理论、从中推导
出假设,然后让假设接受各种技术或方法的检验
——我们将在本书余下的部分讨论这些技术。如
果假设通过了某些实验的检验,该理论就得到了
某种程度的确证;如果假设被实验证伪,这个理
论就得做出某种程度的改变,或者被一个新理论
所取代。
当然,虽然科学上的知识是暂时性的,由理
论得出的假设可能是错误的,但这并不是说所有
的一切都要被拿来检验一番。科学中有很多理论
已经被确认过无数次,它们被称为“公理”,因为
它们几乎不可能被未来的实验推翻。我们不大可
能在某一天发现,血液不是循环的,或者地球并
没有在环日轨道上。这些众所周知的事实并不是
我们一直在讨论的假说。它们也不是科学家们的
兴趣关注点,因为它们已经是确定无疑的。科学家只对已有知识范围之外的问题感兴趣。对于确
定无疑的事实,他们毫无兴趣。
科学实践的这一面——科学家侧重于已知事
实的前沿,而忽视那些已经被充分证实的问题
(所谓的公理)——对大众来说很难理解。科学
家们似乎总是更强调未知的事物而非已知事物。
这千真万确,而且科学家有很好的理由这么做。
为了推进知识的进步,科学家们必须一直身处已
知的前沿。当然,这里是很多事情都不确定的地
方。但科学进步正是通过这个过程来实现的,即
试图在已知的前沿减少不确定性。这种特点常常
使得科学家被公众视为“没谱的”。但这只是表面
现象,科学家们只是对知识的前沿不确定——这
使我们对于事物的理解不断加深。科学家们不怀
疑那些被很多研究重复证实的事实。
同样需要强调的是,当科学家通过观察法证
伪一个理论或用一个新理论代替旧理论的时候,并不意味着他们要将先前用以建立旧理论的事实
全都扔到一边(我们会在第8章展开讨论这个话
题)。相反,新理论应该能够解释所有旧理论能
解释的事实,还能够解释旧理论不能解释的事
实。理论被证伪并不意味着科学家非得建构一个
全新的理论。复杂的理论通常是大体正确而非完
全正确的,大体正确的判断可能更接近事实的真相(Radcliffe Richard, 2000)。
科普作家伊萨克·阿西莫夫(Isaac Asimov)
在一篇题为《错误的相对性》(The Relativity of
Wrong, 1989)的文章中很好地说明了理论修正的
过程,文中谈到我们对地球形状的理解是如何完
善的。他首先提醒我们,不要以为“地球是平
的”这一古老信念是愚蠢的,在平原上(大部分
有文字的人类文明都发源于平原),地球看上去
相当平坦。阿西莫夫要求我们试着对不同的理论
进行定量的比较,看结果会告诉我们什么。首
先,我们能够将不同理论表述为它们预测地球表
面每公里曲率的大小。“地平理论”会说每公里的
曲率为0。现在我们都知道,这种理论是错误
的。但从某种意义上说,它又很接近真理。正如
阿西莫夫(1989)所说:
亚里士多德之后的一个世纪,古希腊的
另一位哲学家埃拉托塞尼斯
(Eratosthenes)指出,太阳在不同纬度上
投射不同长度的影子(如果地球是平面的,所有的影子都应该一样长)。根据影子长度
的不同,他计算出地球的周长为2.5万英
里,那么这个球体曲率是0.000126度英
里。正如你所见,这个数值非常接近0……
这从0到0.000126的差别解释了为何我们用了如此长的时间,才放弃“地球是平的”这
一观念,并转而相信地球是球状的。提醒你
一下,即使是像0~ 0.000126之间这样细小
的差别也是至关重要的。失之毫厘,谬以千
里。如果这点小差别没有被考虑到,如果地
球被认为是一个平面,而不是一个球,那么
我们将无法精确地绘制地球上大面积区域的
地图(pp. 39-40)。
当然,科学并没有止步于“地球是球体”这一
理论。我们早先讨论过,科学家们一直在尝试尽
量改进他们的理论,并挑战当前知识的局限。例
如,牛顿的引力理论预言地球并不是完美的球
形,这个预言确实被证实了。现在已经证明,地
球在赤道附近略微凸起,而在两极附近略微扁
平。这是个被叫做“扁球体”的形状。地球从北极
到南极的直径是7900英里,赤道直径是7927英
里。所以,地球的曲率并不是一个常数(像一个
理想的圆球那样),而是在每英里上有约7.973英
寸到8.027英寸的微小变化。正如阿西莫夫
(1989)所言:“从球体到扁球体的修正比从平
面到圆的修正要小得多。因此,虽然‘地球是球状
的’这一理解有误,但严格地说,它没有错到‘地
球是平的’那种程度。”(p.41)
阿西莫夫关于地球形状的例子为我们展示了科学家们使用“错误”、“误差”和“证伪”这些术语
的不同情境。这些术语并不是说被检验的理论错
得一无是处,这些理论仅仅是不完善的。所以,当科学家强调说理论是暂时性的、可能被未来的
研究发现所修正的时候,他们所指的就是例子当
中的情形。当科学家相信地球是球状的时候,他
们认识到在未来某一天,这个理论需要在细节上
进行修正。无论如何,从球体到扁球体的变化维
持了地球是一个球体的“大体正确性”。我们绝不
会在某天醒来突然发现它其实是一个立方体。临
床心理学家斯科特·利连恩费德(Scott Lilienfeld,2005)向心理学专业的学生这样介绍阿西莫夫的
观点:
当向学生解释心理学知识本来就是暂时
性的、可以被修正的时候,有些学生会错误
地得出结论,认为真正的知识是不存在的。
这种观点在某些后现代主义圈子里非常流
行,它忽视了对不同确定程度的知识的区
分。虽然绝对的肯定在科学中无法实现,但
一些科学理论,如达尔文的自然选择学说,已经被极好地证实了,而其他一些理论,如
支持占星术的理论,已经遭到了有力的驳
斥。还有一些理论,如认知失调理论,仍处
在科学争议当中。因此,科学理论是个确定
程度不同的连续体:有些已经成为了确定的事实,另外一些则被完全地证伪了。对于科
学问题,方法论上的怀疑主义并不产生完全
确定的答案(原则上说,这些答案可能会被
新的证据推翻),这个事实并不意味着知识
是不存在的,只是说知识是暂时性的。
(p.49)
“科学必须产生确定的知识”这一错误信条常
常被用来攻击科学。古生物学者尼尔·舒宾(Neil
Shubin)描述了神创论者如何利用这一策略。在
和科学作家纳塔利·安吉尔(Natalie Angier,2007)的访谈中,舒宾说:“神创论们首先试图
将科学描绘成铁板一块的事实,然后攻击那些‘确
定’中不是特别确定的事情。他们叫嚷着‘哈!你
自己都理不清思路了吧,你太不不靠谱了。那我
们为什么要相信你所说的一切呢?’其实是他们首
先竖起了一个‘科学毫无瑕疵’的稻草人当靶
子。”(p.20)小结
科学家们提到“可解的问题”时,通常指的
是“可检验的理论”。“可检验的理论”的定义在科
学上是非常明确的:这个理论是有可能被证伪
的。如果一个理论不可证伪,并且和自然界的真
实事件没有关联,那么它就是无用的。心理学里
一直充斥着不可证伪的理论,这也正是心理学发
展缓慢的原因之一。
好的理论能够作出具体的预测,具有高度的
可证伪性。相比于一个不精确的预测,如果一个
明确具体的预测得到证实,就会为产生这个预测
的理论提供更大的支持。简言之,可证伪性原则
的一个含义就是,并非所有理论的验证都具有同
样的价值。可证伪性越高,预测越具体,得到证
实的理论就越受青睐。即使预测并没有得到证实
(比如它们被证伪了),可证伪性对于理论的发
展也是有用的。一个被证伪的预测说明,原有理
论要么应当抛弃,要么需要进行改变,以解释不一致的数据。正是通过这种由被证伪的预测所引
发的理论修正,像心理学这样的科学才能逐步向
真理逼近。Chapter 3
操作主义和本质主义:“但是,博士,这到底是什么意思?”
物理学家真正理解地心引力是什么吗?我的
意思是“真正”。他们知道“地心引力”这个术语的
真正含义是什么?它的内在本质是什么?说到地
心引力时,最终所要表达的意思是什么?说到
底,它究竟是什么?类似这样的问题反映了一种
科学观点,哲学家波普尔称其为“本质主义”。这
种观点认为,从内在本质或者本质属性的角度对
现象作出最终解释,才算得上是好的科学理论。
支持这种观点的人通常也相信,无法对现象作出
最终解释的任何理论都是无用的,这样的理论不
能反映真实的内在情况,不能反映世界存在方式
的本质。本章,我们将讨论为什么科学不去回答
本质主义者的问题,而是通过对概念进行操作性定义得以进步。为什么科学家不是本质主义者
事实上,科学家并不企图获得本质主义者所
追求的那类知识。从这一意义上讲,对于本章一
开始提出的问题的正确回答是:科学家不知道地
心引力是什么。科学并不试图回答关于宇宙
的“终极”问题,彼·得米德瓦(1984)曾写道:
确实存在那些科学不能回答并且在科学
发展的可预见的范围之内也不可能得到答案
的问题。比如,那些孩子们会提出的问题
——“终极问题”……我能想到的这样的问
题有:世界是如何开始的?我们来到这世间
是为了什么?生活的意义是什么?(p.
66)
然而,即使科学不能回答终极问题,也
不意味着必须接受其他的答案;也不能理所
当然地认为,既然这类终极问题能被提出,就一定能够被回答。就我们目前的理解力而
言,这类问题是无从回答的。(p. 60)但是,最终就其能回答的那类问题而
言,科学的潜力是无穷的……没有什么可以
阻挡或终止科学的发展,除了诸如缺乏勇气
之类的道德方面的缺陷。(p. 86)
科学家之所以质疑那些自称为终极问题给出
绝对答案的人、理论或者观念体系,一个原因就
是科学家认为终极问题是无法回答的。科学家并
不会宣称他们可以提供完美的知识;科学的独特
优势并不在于它是一个不会犯错的过程,而在于
它提供了一种消除错误的方式,它能不断消除我
们认识中的错误。再者说,自称完美或绝对知识
的主张及做法,却往往会阻碍人们的探索。自由
而开放地探索知识是科学活动的一个先决条件。
科学家们总是在怀疑那些号称已经找到问题最终
答案的言论。
本质主义者喜欢咬文嚼字
本质主义者的态度通常有一种表现:在探求
知识之前,过于关注术语或概念的定义。“但
是,我们必须首先界定我们的术语”是本质主义
者常用的一个口号。“某理论性概念的真正含义
是什么”这种理念似乎意味着,当一个词被当作理论中的概念使用之前,我们必须对这个词的使
用所涉及的所有潜在语言问题有一个全面且清晰
的理解。事实上,这正好与科学家的工作方式相
反。在对物理世界开展研究之前,物理学家不会
花费气力讨论如何使用“能量”一词,或者当我们
讨论物质的基本组成时,“粒子”一词是否真正表
达了我们要表达的本质含义。
在科学领域里,确定某概念的意义,是在与
该术语有关的现象得到一定程度的研究之后,而
非研究之前。一个精确的概念性术语来自科学过
程中固有的那种数据和理论间的相互作用,而不
是关于语言用法的辩论。本质主义者让我们陷入
无休止的文字争论,而许多科学家坚信这样的文
字游戏使我们脱离了事物的实质。例如,对
于“生命一词的真正含义是什么”这个问题,两个
生物学家给出的令人惊讶的回答是“没有什么真
正的含义,它只是足够好地满足我们生物学家工
作需要的一种用法,并不是争论或辩驳的主
题”(Medawar Medawar, 1983, pp. 66-67)。总
之,科学家的目的是解释现象,而非对措词进行
分析。在所有的科学学科里,进步的关键在于放
弃本质主义,接受操作主义。这正是本章中我们
探讨的主题。操作主义者将概念和可观测的事件联系
在一起
那么,如果不是来自语言文字的争论,科学
中概念的含义又来自哪里呢?正确使用某一科学
概念的标准是什么?为了回答这些问题,我们必
须讨论操作主义。它对于在科学领域中建构理论
至关重要,尤其对于评估心理学中的理论及观念
具有重要作用。
尽管操作主义形式多样,但是对于科学信息
的使用者来说,用最宽广的思路去思考操作主义
是最有效的。“操作主义”只是这样一种思想:科
学理论里的概念必须立足于可观测事件,或与可
观测事件相关联,而这些可观测事件是可以被测
量的。将概念与可观测事件相联系的是概念的操
作性定义,这使概念公开化了。操作性定义使得
概念从个人化的感觉和直觉中分离出来,并且允
许任何实施可测量操作的人对概念进行检验。
例如,把“饥饿”这个概念定义为“我胃里不好
受的感觉”,并不是一个操作性定义,因为它与
个人对于“不好受的感觉”的体验相联系,因此不
能被其他观察者知悉。相反,涉及一些可测量的
食物剥夺时间或者像血糖水平这样的生理指标的定义才是可操作性的,因为它包含了任何人都可
以实施的可观测的测量。同样,心理学家不同意
将“焦虑”定义为“我不时会感到的不舒服和紧
张”,而是必须用像问卷和生理指标测量这样的
操作来定义概念。上述那个定义是个人对身体状
况的解释,他人无法复制;而后者则是把概念放
在公共科学领域进行解释。
在科学领域里,定义一个概念靠的是一系列
操作,而非单独的行为事件或任务,意识到这点
非常重要。相反,一些差别细微的任务和行为事
件通常聚合在一个概念上(在第8章我们将会更
多地讨论聚合性操作)。例如,教育心理学家根
据利用诸如《伍德库克阅读能力量表》之类
(Woodcock, 2011)包含一系列任务的标准化工
具测得的成绩来定义“阅读能力”这个概念。该量
表测出的阅读能力总分包含了一些不同分量表测
得的能力指标。这些分量表测查的能力稍有不
同,例如,阅读一篇文章、想出一个合适的单词
在文章中填空、写出一个词的同义词、独立拼读
一个较难的词,等等。所有这些任务上的表现综
合地定义了“阅读能力”这个概念。操作性定义促
使我们认真地、经验性地思考我们如何定义一个
概念,所谓经验性,是指要根据我们对真实世界
的观察。试想,我们要给一个看起来相当简单的
概念“打字能力”下一个操作性定义。想象一下你这么做是为了比较两种打字教学方法的优劣。思
考一下你所要做的所有决定。当然,你想要测
量“打字速度”。但是要打多长的一段文章呢?仅
有100个单词的文章可能太短,而10000个单词的
文章又似乎太长。那么到底多长才算好呢?打字
速度维持多久才最符合我们对打字能力这一概念
的理论建构?用什么类型的文章来测试呢?文章
是否要包含数字、公式和不常见的间距?我们如
何处理错误?当我们测量打字能力的时候,时间
和错误似乎都应被考虑在内,但是如果把这两个
指标同时考虑进去的话,要如何来计算一个总分
呢?我们想要让时间和错误具有相同的权重,还
是一个比另一个更重要?寻求一个好的操作性定
义会迫使你认真考虑所有这一切:它会让你对如
何将“打字能力”进行概念化做一番透彻的思考。
考虑美国食品和药物管理局(the Food and
Drug Administration, FDA)的任务,他们决定什
么是各类食物“不可接受”的污染水平,什么被认
为是食品中“不可避免的缺陷”(Levy, 2009)。作
为FDA这样的联邦机构也不能够依靠主观作出判
断。这需要在检查每种食物时,对每种污染物的
操作定义进行严格规范。例如,它构建了以下类
型的操作定义(Levy, 2009):番茄汁中“不可接
受”的污染水平是每100克中超过10个苍蝇卵,蘑
菇中“不可接受”的污染水平是每100克有五个以上的2毫米以上的蛆。简单粗暴却极具操作性!
信度和效度
对一个概念下操作定义包括测量:通过一些
法则给观测结果赋值。科学作家查尔斯·塞费
(Charles Seife, 2010)指出,当我们在测量使用
数字时,我们才突然开始重视它们。他认为,如
果数字不作为抽象符号使用,非数学家几乎不关
注数字的性质。我们不会关注数字5本身。但是
一旦数字5变成“5磅”或“5美元”,或是“通货膨胀
率为5%”,又或是“智商5分”——突然之间,我们
便开始关注这了。塞费(2010)说:“没有单位
的数字是抽象而缥缈的。有了单位,它获得了意
义,但是同时它也失掉了自身的纯粹
性”(p.9)。赛费所说“失去纯度”的意思是一旦
涉及测量,就是说给数字附加单位,我们突然关
心数字的“正确”性质。在科学上,什么是数字
的“正确”性质呢?这个问题的答案是,在科学
上,数字应该有的“正确”性质是信度和效度。
概念的操作性定义要想有用,必须同时具备
信度和效度。信度是指测量工具的一致性。如果
你对同一概念进行多次测评,是否能够得到相同的测量结果。信度的科学概念很容易理解,因为
它与常识中的定义以及字典里的定义非常相
似:“任何总能够产生相同结果的系统所具备的
一种属性”。
试想一下,一个外行人士会如何评价一件事
是否可信呢?想象一个每天早上要赶公共汽车从
新泽西去曼哈顿上班的人。按照时间表,公共汽
车每天应该在上午7:20到达此人等车的站点。在
一个星期中,如果公共汽车到达的时间分别是
7:20、7:21、7:20、7:19和7:20, 那么我们就可以
说在那一周汽车的到达时间是可信的,如果下周
汽车到达的时间分别是7:35、7:10、7:45、7:55和
7:05, 那么我们就可以说在那一周汽车的到达时间
是非常不可信的。
在科学领域中,一个操作性定义的信度以类
似的方式来评估。如果我们多次测量同一概念得
到的结果是近似的,那么我们就说测量工具表现
出较高的信度。如果在同一星期的周一、周三和
周五,用同一IQ测验的不同版本测量同一个人的
智力,得到的分数分别是110、109、110, 那么我
们可以说这一IQ测试是非常有信度的。相反,如
果三个测试分数分别是89、130和105, 那么我们
就可以说这一IQ测试没有显示出高信度。有一些
专门的统计方法可以评估不同类型的测量工具的信度,所有标准的方法论入门教材中都有介绍。
但是请记住,信度仅仅是指前后一致,而不
包括其他内容。对于一个操作性定义而言,仅有
信度是不够的,信度是一个必要而非充分条件。
作为一个好的操作性定义,操作必须被证明对于
概念来说是有效的测量。“结构效度”这个术语是
指一个测量工具(操作性定义)是否测量了它本
应测量的内容。保罗·考兹比教授(Cozby, 2012)
在其所著的方法论教材中为我们讲述了一个只有
信度而没有效度的搞笑例子。假设你想测测自己
的智力,测试者让你站到一个类似鞋码器的测试
仪器上,然后仪器给出一个读数。当然,你会认
为这是一个笑话。但是请注意,这个测量工具可
以显示许多类型的信度,而这些信度在方法论教
材中都会讨论到。这个仪器在星期一、星期三和
星期五会呈现出相当一致的读数(这称之为“重
测信度”),并且无论谁操作它,它都会给出一
样的读数(称之为“评分者信度”)。
用鞋码器来测量智力,其问题不在于信度
(这是有信度的),而在于效度。它不是一个测
量其本应测量的概念(智力)的合理方式。断定
它不是测量智力的有效方式的证据之一,就是我
们发现它和其他一些被认为与智力相关的变量无
关。鞋码器的测量结果与学业成就无关,与脑功能的神经生理学测量无关,与职场成功无关,与
认知心理学家提出的信息加工效率的指标无关;
相反,真正的智力测验与所有这一切都有关
(Deary, 2001; Deary et al., 2008; Duncan et al.,2008; Flynn, 2007; Geary, 2005; Hunt Carlson,2007; Lubinski, 2004)。在心理学领域,真正的
智力测验要兼顾效度与信度,而智力的鞋码器测
验只有信度而没有效度。
在这一点上,你可能想知道信度和效度的其
他组合方式是否可行。因此,让我来重申一下我
们的立场。在操作性定义中,我们寻求信度和效
度兼备,因此高信度和高效度结合才是理想的目
标。我们刚刚讨论了鞋码的IQ测试,目的是论证
高信度和低效度是没用的。第三种情况是低信度
和低效度,这绝对没有用,因此不值得讨论。但
是你可能想知道第四种,也就是最后一种可能的
组合方式:如果高效度和低信度又怎么样呢?答
案是和低效度和高信度的例子(鞋码器例子)一
样,这种组合也是没用的。事实上,更准确的说
法是,这类情况压根儿不可能出现。因为,如果
不能进行可信的测量,你根本无法宣称测量是有
效的。
当形成有效的操作定义时,精确我们要测量
的概念是十分重要的。例如,美国橄榄球联赛(NFL)中评价四分卫时会用到“传球评
分”(passer rating)这个指标(Sielski, 2010)。
意识到这个指标被精确地确定为“传球评分”很重
要。也就是说,它很明确不是四分卫评分指数。
那是因为“传球评分”的操作定义把只是四分卫传
球而不是四分卫做的每件事情考虑了进去。具体
地说,传球率是一个数学公式,包括四个方面:
完成传球百分比、每次传球尝试的码数、每次传
球尝试的触地得分、每次传球尝试的拦截。传球
评分指数统计数值不包括:四分卫跑的码数、呼
叫战术能力、胜负记录、在争球线后抱摔、掉球
和其他一些可量化的四分卫变量。为此,在另一
个操作定义下的叫做“四分卫总评分”的概念产生
了。
直接和间接的操作性定义
概念和可观测的操作之间的联系,在直接和
间接性程度上变化很大。很少有科学概念几乎完
全是通过可观测的操作来定义的。大部分概念的
定义采用更为间接的方式。例如,一些概念的使
用既取决于一系列的操作,又取决于它和其他概
念之间的特殊关系。最后,还有一些概念不通过
可观测的操作直接定义,而是通过它与另外一些概念间的关系来定义的。这种概念有时被称
为“潜在概念”,在心理学中非常普遍。
举个例子来说,许多研究关注所谓的A型行
为模式,因为它与冠心病的发病率有关(Chida
Hamer, 2008; Martin et al., 2011; Matthews, 2005;
Smith, 2003; Suls Bunde, 2005)。在第8章中,我
们将会更加详细地讨论A型行为模式。但是,这
里重点要说的是,A型行为模式实际是通过一系
列二级概念来定义的:强烈的竞争欲望、潜在的
敌意、赶时间行为、达成目标的强烈驱力,等
等。然而,每一个用于界定A型行为模式特征的
概念本身也都需要操作性定义。事实上,研究者
们已经为对每个概念进行操作性定义而付出了很
多努力。我们讨论的要点是,A型行为模式是一
个复杂的概念,它并不是被操作所直接定义的。
相反,该概念与其他一些各自具有操作性定义的
概念联系在一起。
A型行为模式提供了一个间接操作性定义的
例子。在临床心理学上,有一个相似的概念定义
是痛苦耐受性(Zvolensky, Vujanovic, Bernstein,
Leyro, 2010)。这个整体的概念由几个简单的依
赖于操作测量的子概念构成:对不确定性的容忍
度、歧义容忍度、挫败容忍度、负面情绪容忍度
以及身体不适容忍度。简而言之,尽管不同的概念与可观测操作的
联系程度各有不同,但所有的概念都在一定程度
上通过其与可观测操作之间的联系来获得意义。
科学概念的演进
一个科学概念的定义并不是固定不变的,而
是随着相关观测结果的不断丰富而发生变化。意
识到这一点非常重要。如果一个概念的原始操作
性定义在理论上被证明是无效的,那么该定义就
会被抛弃,以另外一套定义的操作取而代之。这
样,随着相关知识的积累,科学概念不断演进,其抽象性逐渐增加。例如,在一段时间里,人们
认为电子是一个围绕原子核旋转的带负电的微小
球体。而如今,电子被视为在特定实验条件下,具有似波特性的概率密度函数。
在心理学领域,智力概念的发展提供了一个
类似的例子。起先,智力仅有一个严格的操作性
定义:智力是通过心理功能测验所测到的东西。
随着实验证据的不断积累,智力被证明与学业成
就、学习、脑损伤、神经生理学及其他行为和生
物学变量有关,这一概念在逐渐丰富的同时又得
到了提炼(Deary, Penke, Johnson, 2010; Duncanet al., 2008; Sternberg Kaufman, 2011)。现在看
来,在定义智力概念时,最好用一种高等级的建
构,通过多种更为具体的信息加工操作来定义。
当然,这些假设的信息加工过程应该具备更为直
接的操作性定义,可以用可测量的指标来表述。
人类记忆理论中的概念也以同样的方式发
展。现代心理学家很少使用类似“记忆”或“遗
忘”这样的笼统概念;相反,他们测量那些可以
进行明确定义的记忆子过程,如短时听觉记忆、符号存储、语义记忆以及情景记忆。传统的“记
忆”或“遗忘”的概念通过更加明确的操作性概念得
到了细化。
因此,理论术语的用法在科学实践中不断演
进,而不是在针对文字意义的争论中获得发展。
这是科学的操作态度和本质主义者在追求绝对定
义之间最显著的区别。哲学家保罗·邱吉兰德
(Churchland, 1988)强调,在科学中,对概念的
定义不是源于文字界定,而是源于与之相关的观
察和其他概念:
要想完全理解“电场”这个概念,我们
就必须熟悉这一表述所处的理论原则体系,它们会共同告诉我们,电场是什么、做什
么。这是一个典型的例子。通常来讲,理论性术语的意义不是从单一的、具体描述其所
适用的必要充分条件的定义中获得的,它们
往往通过所在的理论原则体系而被间接地定
义。(p. 56)
随着科学概念的演进,概念常常与许多不同
的理论体系交织在一起,并且获得多种操作性定
义。这种情况的出现并不是因为概念本身出了问
题。例如,许多人认为心理学不可信,因为心理
学中许多重要的理论概念——例如智力,可以用
不止一种方法来操作化和概念化。但这种情形并
非心理学所独有,也不是一件令人绝望或束手无
策的事情。事实上,在科学领域里,这种情况是
普遍存在的。例如,“热”既可以从热力学理论,也可以从动力学理论的角度来概念化。物理学并
未因此遭到贬斥。想想电子,它的许多特性都是
以波的概念来解释的。可是,如果将其视为粒
子,它的另外一些属性则更好理解。到目前为
止,还没有一个人会因为物理学中存在着这些多
重概念化现象就提出要抛弃它。
2006年,人们在这一点上有了深刻的认识。
当时媒体报道国际天文联合会(International
Astronomical Union)对“行星”的定义重新进行了
操作化,并将冥王星排除在外(Adler, 2006;
Brown, 2010)。像“行星”这样基础的概念都会发生变化,确实让公众大为震惊,但这在科学领域
是司空见惯的。在行星定义这件事儿上,一些天
文学者倾向于强调天文主体的构成和地质因素;
另一些天文学者则强调行星的动力属性,例如它
们的轨道和重力影响。在前一组天文学家的操作
性定义中,冥王星是行星,而在后一组天文学家
的操作性定义中,冥王星则不是行星。不同的操
作性定义反映的不是天文学界的混乱,它们只是
反映从不同角度定义概念的方式。在心理学上也
是一样,一个概念也有许多可选择的操作性定
义。有些事物难以定义,并不代表没有可研究的
东西。心理学领域的操作性定义
许多人在思考物理学或化学的时候,能够理
解操作主义的必要性。他们知道,如果科学家准
备谈论某一类型的化学反应、能量或者磁场,就
必须有相应的方法来测量。不幸的是,当人们谈
到心理学的时候,却经常无法认识到操作主义的
必要性。为什么人们没有同样地认识到这一显而
易见的事实:为了成为科学理论中有用的解释体
系,心理学术语必须被直接或间接地操作化定
义?
人们对心理学产生误解的原因之一,就是心
理学上所说的“预设偏见”。在第1章中,我们提
到过这个问题。人们不会因为执着于某种关于岩
石性质的信念来研究地质学,而在心理学中,情
况就大为不同了。我们每个人都有关于人格和人
类行为的直觉理论,我们用它们来“解释”自己以
及他人的行为。我们所有的个人心理学理论里都
包含着理论性概念(例如聪明、攻击和焦虑)。因此人们会很自然地发问:“为何我们必须接受
一些其他的定义?“尽管这种态度从表面上看来
是合理的,但对于任何致力于理解人类行为的科
学来说,它都是一个巨大的障碍,也是公众对心
理学产生困惑的一个原因。
误解产生的最主要原因,就是心理学中的许
多专业概念都是用日常用语来表达的,这也是媒
体在准确呈现心理学成果方面最大的障碍。这些
日常用语为大量误解的传播敞开了大门。外行人
很少意识到,当心理学家把“智力”、“焦虑”、“攻
击”、“依恋”等词语当作理论性概念来使用时,它
们的含义和大众平常所说的意思不一定相同。
从之前关于操作主义的讨论中,就能看出这
种区别的本质。当在心理学理论中使用如“智
力”、“焦虑”这些术语时,它们直接或间接的操作
性定义决定了它们的正确用法。那些定义常常具
有高度技术性,通常具有特定意义,并且在许多
方面都不同于这些术语在日常生活中的运用。例
如,当我们听到“对大样本的认知任务进行因素
分析所得到的第一个主成分”这段话时,许多人
都意识不到它是术语“智力”的操作性定义。
同样,如果外行人使用术语“抑郁”,那就意
味着“感觉糟透了”。相反,在《精神疾病诊断与统计手册》(Diagnostic and Statistical Manual of
Mental Disorders)中,对抑郁 ......
本质
作者:(加)基思·斯坦诺维奇
本书由“行行”整理,如果你不知道读什
么书或者想获得更多免费电子书请加小
编微信或QQ:2338856113 小编也和结
交一些喜欢读书的朋友 或者关注小编个
人微信公众号名称:幸福的味道 id:
d716-716 为了方便书友朋友找书和看
书,小编自己做了一个电子书下载网
站,网站的名称为:周读 网址:
http:www.ireadweek.com目录
CONTENTS
序言
推荐序 心理学有什么不同之处
译者序
序言
Chapter 1 心理学充满生机:在科学阵营里左
右逢源
弗洛伊德问题
现代心理学的多样性
科学的统一性
那么,什么是科学
心理学和世俗智慧:“常识”的误区
心理学是一门年轻的科学
小结
Chapter 2 可证伪性:如何挫败头脑中的小精
灵
理论和可证伪性标准
科学中的错误:逼近真理
小结
Chapter 3 操作主义和本质主义:“但是,博
士,这到底是什么意思?”为什么科学家不是本质主义者
心理学领域的操作性定义
小结
Chapter 4 见证和个案研究证据:安慰剂效应
和了不起的兰迪
个案研究的地位
为什么见证叙述毫无价值:安慰剂效应
“鲜活性”问题
见证为伪科学打开方便之门
小结
Chapter 5 相关和因果:用“烤箱法”避孕
第三变量问题:戈德伯格与糙皮病
方向性问题
选择性偏差
小结
Chapter 6 让一切置于控制之下:聪明汉斯的
故事
斯诺与霍乱
比较、控制和操纵
小结
Chapter 7 不像是真实生活的心理学实验与“人
为性”批评
为什么自然性并非总是必要的
心理学理论的应用
小结Chapter 8 避免爱因斯坦综合征:聚合性证据
的重要性
关联性原则
科学共识
不要对矛盾数据感到绝望
小结
Chapter 9 打破“神奇子弹”的神话:多重原因
的问题
交互作用
单一原因解释的诱惑
小结
Chapter 10 人类认知的阿喀琉斯之踵:概率推
理
“某某人”统计学
概率推理以及对心理学的误解
有关概率推理的心理学研究
小结
Chapter 11 偶然性在心理学中扮演的角色
试图解释偶然性事件的倾向
偶然性和心理学
接受错误以减少错误:临床预测与统计预
测
小结
Chapter 12 不招人待见的心理学
心理学的形象问题心理学和其他学科
我们是自己最坏的敌人
每个人不都是心理学家吗
抵制科学心理学的根本原因
结束语推荐序 心理学有什么不同之处
彭平凯 清华大学心理学系教授、系主任
心理学是一门很容易让人误解的学科。与其
他学科不同,它研究的是与人民生活紧密相关的
问题。有些还正好是大家都熟悉,而且经常关心
的问题。比如:什么样的人容易讨人喜欢?什么
样的事情我们记忆深刻?什么样的事情让人高兴
(或痛苦)?为什么男人比女人更爱聊政治时
事?人为什么要自杀?意念能不能被植入梦中?
等等……正因为大家关心这些问题,人们就会有
自己的分析,自己的证据,得出自己相信的结
论。很多时候,这些自觉的结论与心理学家的研
究结论并不完全一致,比如说,我们心理学家就
发现,青梅竹马的婚姻很难成立,婴儿并不是有
奶便认娘,性格并不决定一个人的命运,等
等……每当矛盾、怀疑、迷惑甚至气愤产生的时候,我们到底是该相信自己的直觉、经验和常识
呢,还是该相信心理学的研究、证据和知识呢?
不幸的是,大多数的心理学教科书只满足告
诉大家心理学的研究、发现和知识,但从不说明
为什么这些研究、发现和知识是值得我们关注和
信任的。这些书的作者好像都在假设每一位读者
思考起问题来都像心理学家一样,相信和理解心
理学的研究、发现和知识。幸运的是,基思·斯坦
诺维奇教授写了这本这本《这才是心理学》,一
本“与众不同的心理学”教科书。他总结了心理学
家的职业特质,让每一位读者都有机会去理解我
们心理学家是如何去思考、分析和解读人类的行
为和心理的。他的每一章都将一个常识的、朴素
的、直觉的有关人类心理的分析和思考与一个科
学的、严谨的、心理学的分析和思考相对比,以
帮助读者理解心理学家的分析逻辑和研究思路。
我个人觉得,在斯坦诺维奇阐述的心理学特
质中,有两点应该是区分我们心理学家和其他人
(包括其他领域的科学家)与众不同的地方。
其一是我们心理学的批判性思维习惯,也就
是说,心理学不相信个人的智慧,更相信科学的
方法,而科学方法的本质是证伪,即对我们的经
验、常识和直觉,产生怀疑、挑战和批评。从原则上而言,心理学家不怕犯错误,但害怕以假乱
真。心理学家也不相信那些能回答所有问题的绝
对真理,但相信对所有问题应该有一个相对正确
的答案。心理学家从不相信个案和例子,因为其
随机性和主观性太过明显,但我们愿意相信大样
本基础上的科学研究发现。我们希望听到动听的
心理故事,但更愿意看到众多心理学观察的数据
和总结。
其二是我们心理学的概率性思维习惯。我们
和很多自然科学家思考方式不同之处就在于我们
更容易相信,任何人类的行为都是概率性的表
现,也就是说,它有一定的不确定性,会受到其
他随机事件的影响。其实人类很多学科都是建立
在概率基础之上的,比如说核物理、天体物理、生物进化、病理学、所有的社会科学(经济学、社会学、政治学等)等等,它们都不可能准确预
测每一个研究对象的具体活动,但都对整体的事
物活动规律有很好的描述和预测。只不过我们心
理学家更愿意承认而且强调我们学科的不确定性
而已。
总之,我很高兴地看到这本书在中国再版。
杨中芳老师的早期译本是我很喜欢向心理学爱好
者推荐的一本心理学教科书。而新版的译本,尤
其令我兴奋,因为它是由我欣赏的两位年轻同事——东徽和肖岑,下工夫,花时间,认真翻译完
成的。两位既是同行,也是夫妻,应该是我们心
理学界不鲜见的学术伴侣之一。这可能也是我们
心理学界与众不同的地方吧。译者序
此刻诸位手中拿的正是斯坦诺维奇教授的
《这才是心理学:看穿伪心理学的本质》(How
to think straight about psychology)第10版中译本。
记得我的博士后合作导师、清华大学心理学系主
任、加州大学伯克利分校终身教授彭凯平老师曾
经说过:在美国,如果一本心理学教科书能够再
版3次以上,这本书就堪称经典教材了。按照这
一标准,斯坦诺维奇教授这本书堪称经典教材中
的翘楚,无怪乎能够成为诸多国家高校心理学本
科专业学习的指定书目。
斯坦诺维奇教授曾感慨,写作最新一版的初
衷,与写第一版时无异。此感慨中有不忘初心方
得始终的赤子情怀,但也有些许的无奈:心理学
被大众误解的状况多年来并未有实质性的转变,心理学这些年的蓬勃发展也没有使这一情况有根本性的好转。对于这一点,相信每一位学习和从
事心理学的人都有所体会。
时至今日,每个学心理学专业或从事心理学
工作的人仍然会被人问到三个问题,第一个通常
是:“你知道我现在心里在想什么吗?”名列榜眼
的问题则是:“你会催眠和解梦吗?”排名第三的
问题则一般是:“什么,你们心理学还做实
验?”这类对于问话人来说再正常不过的问题,却总能让这些学心理学的人哭笑不得。
一个真正称职的心理学工作者不应回避或敷
衍这类问题,正确的做法是直面它们并认真分析
其中的意义,给予人们正确的解答。从最常被问
到的这三个问题中,我们便能以管窥豹地看出公
众对于心理学的一些常见的误解和迷思。
第一个问题所揭示的事实是,心理学在大众
心目中被万能化了。所谓万能化,是指心理学研
究对象和功能的边界被无限地夸大了。首先,许
多人认为心理学无所不包,星座、属相、血型、玄学、人生哲理及各种心灵鸡汤都被认为是心理
学的范畴——实际上,心理学研究虽然涉及广泛
的人的客观行为和心理现象,但作为心理学的研
究对象必须满足“可检验”这一标准,超验的、超
感官的问题不在科学心理学的研究之列;另外,并不是说心理学不能研究血型、星座和超感知,实际情况是,这类现象和理论在历史上都曾经是
心理学的研究对象,但已被各种科学的方法所证
伪并从心理学的研究对象中剔除了出去。还有一
种观点认为,心理学是无所不能的,学了心理学
就能读心、能算命,甚至能千里之外控制他人的
大脑并操纵其行为,还兼具其他种种神奇的功
效。我们说心理学很神奇,是因为它能在一定程
度上解释心理现象和预测行为,并能提供一些行
之有效的干预方法,但是,科学心理学所有的预
测和解释都基于客观数据,所有的结论都具有概
率的性质,有一定的适用范围和条件,干预方案
也必须符合客观的心理和行为规律。因此没有能
够完美解释一切现象的心理学理论,也没有超出
人类经验以外的干预和应用。
第二个关于催眠的问题则揭示了另外一种对
于心理学常见的误解:心理学就是弗洛伊德的精
神分析,就是心理咨询。弗洛伊德这位伟大的心
理学家确实让后世的心理学研究者“既爱又恨”。
弗洛伊德的功绩在于,他以其非凡的工作投入和
严谨的思辨构筑了一套宏大、晦涩而让人着迷的
理论体系,开启了一片探索人类心灵世界的全新
领域,对社会文化、艺术创作产生了不可估量的
影响,并真正让世人开始了解和重视心理学;迄
今为止他的理论仍然广泛应用于心理治疗和干预的诸多领域。今天人们都能熟练用“焦虑”、“压
抑”、“潜意识”这些词来描述或解释分析自己的心
理状态,也是拜弗洛伊德和他的精神分析学派所
赐。说到心理学家,或许很多人不知道冯特和斯
金纳,但没有人会不知道弗洛伊德。然而,弗洛
伊德的盛名也带来了一系列问题,最主要的是两
点:一是他的光芒掩盖了其他领域心理学研究者
的工作和成就,二是弗洛伊德所构建的这些精巧
的理论很难用实证的方法加以验证,这也为后来
众多伪心理学和虚假治疗手段的滋生和发展留下
了一道后门。
最后一个问题也是最关键的——公众不了解
主流的科学心理学已经在实证主义的道路上行进
了很远。心理学是一门科学,必然要遵循科学的
标准,即研究的必须是实证可解的问题;方法上
要遵循系统的实证主义;研究结论是公开知识,即能够被重复验证(可再现性),并能经过同行
评议。这三条标准也是区分科学心理学和其他伪
心理学的分水岭。心理学的研究因此也与操作定
义、实验组和控制组、变量控制、数据统计等词
汇联系起来,而不是个人化的体验及感悟、头脑
风暴或纯粹的逻辑推导。
那么,是什么阻碍了公众了解和认知真正的
科学心理学?原因应该是多方面的。首先,对心理学的渴求使得大众对心理学产生了特殊的期
待。心理现象和心理问题与每个个体戚相关,人
们试图通过心理学解释这些问题和现象,并从中
获得行之有效的帮助和建议。在这方面,针对个
体的精神分析和治疗技术有一定的优势,但其他
大多数心理学研究则针对的是群体的普遍行为规
律,偏重于解释和预测,其研究结论都具有概率
性和领域特异性,因此无法有针对性地、面面俱
到地解决个体所有的心理问题。这有时难免会让
一部分抱着“求医问药”的心态来了解心理学的人
感到失望。此外,以“求医问药”为动机接触心理
学的人,也往往对心理学的其他领域缺乏关注。
第二,术语体系产生的阻隔。心理学作为一
门科学,为了让研究者之间形成共识并利于重复
验证,产生了一套严谨的术语体系,这一点和其
他科学学科并无二致。但不同的是,没有人会因
为不懂量子力学的各种晦涩的术语而鄙视物理
学,但他们却会因不能忍受心理学术语所造成的
隔膜而对科学心理学产生拒斥,继而转向了那些
通俗易懂但科学性无法得到保证的理论或方法。
究其原因,还是因为心理问题和现象与每个人的
关系太为紧密了,最近的需要总是要以最快捷的
方式介入和解决,这就构成了快速实用和科学研
究之间的一对矛盾。第三,心理学许多基础研究确实和大众生活
有一定的距离。在所有的科学门类中,基础研究
转化为实际应用需要时间,有的研究发现甚至要
几十年之后才能体现出其应用价值,心理学的基
础研究向应用的转化也概莫能外。这种滞后性有
时会让人产生一种科学心理学研究毫无意义的错
觉。
最后一个,也是非常重要的一个原因,就是
大众媒体在科学心理学的传播方面做得并不够
好。随着心理学的热度持续升温,许多电视、电
台、网站和出版商和纸媒也不断推出与心理学相
关的节目、书籍或专栏,但由于种种原因(如专
业限制、商业考虑等等),最终呈现在大众面前
并得到广泛传播的往往并不是科学的心理学,而
是包装精美的伪心理学;有一些所谓的“心理学
家”甚至在媒体平台上用错误的理论误导大众。
与之相对应的是,真正的心理学家和专业书籍无
人问津,而星座、血型、养生以及各种未经实证
检验的古怪疗法却打着心理学的旗号招摇过市,让心理学蒙受了许多质疑和指责。
基于以上种种,如何让公众了解真正科学的
心理学变得十分必要。市场上有关心理学的书籍
很多,但对象分化的情况也很突出:针对心理学
专业学生和心理学工作者的专业书籍能够提供很多有用的信息和知识,但有专业门槛的隐形限
制;而针对普通读者的非专业书籍相对通俗但在
信息质量方面良莠不齐。斯坦诺维奇教授所写的
这本《这才是心理学:看穿伪心理学的本质》的
定位则兼顾心理学的初学者和对心理学感兴趣的
更广大的读者群体,从质量来说应为此类心理学
入门读物中之翘楚。在这本20万字左右的书里,作者以生动而严谨的笔触告诉了读者什么才是真
正的心理学。书中重申了科学心理学诸多重要标
准和核心理念,澄清了有关心理学的种种误解和
迷思,有破有立,言之凿凿;理论讲述与精彩的
实验案例交相呼应,集科学性和趣味性于一体,十分耐读;有些犀利的论点足以对读者原有的知
识信念构成挑战,但这种不安很快就会被知识重
构的提升感和思辨的乐趣所取代。
这本书先前的版本曾经由杨中芳老师翻译,已使很多读者从中受益。从第8版开始到今天的
第10版,由我与刘肖岑老师共同翻译,对这3版
的翻译也让我们处于知识更新的喜悦中。书已近
付梓,但译者水平所限,难免有不周或纰缪之
处,还请广大读者给予指正。
本书第10版在第9 版的基础上有所更新,删
除了一些比较陈旧的文献和被最新的研究证明是
有争议的结论,同时补充了最新的研究结论和案例,反映了所涉领域最新的进展。此外,作者对
一些评述文字的说法和措辞进行了调整,使之更
切合所论述的主题。全新升级之后,这一版不仅
原汁原味地保留了之前版本的精髓,同时在内容
上更为丰富和具有时效性。
我们要感谢北京师范大学心理学院邹泓教
授,华东师范大学心理系桑标教授,美国加州大
学伯克利分校教授、清华大学心理学系教授彭凯
平,山东师范大学心理系张文新教授,首都师范
大学心理系方平教授,以及中央财经大学社会发
展学院辛自强教授,在本书翻译过程中给予的指
点和帮助,以及一直以来在学术和思想方面的引
导和教诲。同时,第10版的顺利出版,与人民大
学出版社各位编辑认真严谨的工作是分不开的,在此一并致谢。
要感谢的还有:中央财经大学的张杰、姜
涛、高霖宇、丁志宏、赵然、张红川、黄四林、翁学东、冯源、辛志勇、于泳红、孙铃、苑媛、张梅、侯佳伟、马敏、汪波、赵娜;首都师范大
学的王建平、李莉、田汉族、许晓晖、于开莲、高维华、严冷、刘昊、梁九清、黄翯青、夏婧、钱国英、周楠、孟繁华、丁锦红、郭春彦、王争
艳、王异芳、梁熙等诸位老师,以及我们的学生
陈婷、钱天月、张玉洁、杜宇、弓仲冬、谭洁、张惠、张缙、郭晓红、王娟和齐小琳。感谢你们
在本书翻译、出版过程中提供的各种帮助和支
持。
美国心理学会前任主席、积极心理学创始人
马丁·赛利格曼教授曾用一个、两个和三个词形容
心理学现在的状态,分别
是:“good”(好),“not good”(不好)和“not
good enough”(还不够好)。的确,心理学是一
门蓬勃发展的科学,当前虽然有不尽如人意的地
方,但我们坚信,伴随着每一位科学心理学工作
者的不懈努力,心理学必将变得更好,帮助人们
实现更大的福祉。心存此志,无远弗届。
窦东徽 刘肖岑序言
有这样一门尚不为大多数人所知晓的知识,它涉及人类行为和意识的不同形式,可以被用来
解释、预测和控制人类的行为。学习这门知识的
人能够更好地理解他人,对决定他人想法和行为
的原因有更加全面和精确的认识。
你可能想不到,这门不被知晓的知识就是心
理学。
当我说心理学仍不为人所知时意味着什么?
你一定认为此话不能当真。如今,书店里充斥着
大量标题为心理学的书籍,电视和广播脱口秀定
时播放关于心理学的主题,报纸和杂志也辟有心
理学专栏,怎么能说心理学无人知晓呢?但从某
种关键的意义上来讲,心理学确实仍是一个不为
人知的知识领域。尽管心理学似乎得到了众多媒体的关注,但
是心理学这个知识体系的绝大部分内容仍不为公
众所知。经由大众媒体传播的“心理学”知识在很
大程度上只是一种幻象。很多人不知道他们在书
店里看到的大部分所谓心理学书籍,都是由一些
在心理学界根本站不住脚的人写的;很多人也不
知道,多数在电视上号称心理学家的人,根本得
不到美国心理学会(American Psychological
Association, APA)和美国心理协会(Association
for Psychological Science, APS)的承认;他们更
不知道,大多数频频亮相的心理学“专家”,其实
对心理学领域的知识积累没有作出丝毫的贡献。
媒体这种对于“心理学”话题的浅薄关注,不
仅向公众传递了许多错误信息,还遮蔽了心理学
领域中真正的、不断发展的知识基础。公众不能
肯定到底哪些是心理学,哪些又不是,也不知道
该怎样独立对有关人类行为的主张作出判断。更
大的问题在于,很多人始终觊觎着那些要么缺乏
判断能力、要么认为无法对心理学主张作出判断
的公众。后一种观点有时被称为“无一定之规”的
态度,是本书要讨论的谬误之一,这种心态对社
会危害极大。公众不知道,关于行为的言论是可
以验证的,很多伪科学正是利用公众的这些无知
建立起百万美元的产业。人们并不知道许多伪科
学(例如占星术、通灵外科手术、超速阅读、生物节律、接触治疗、潜意识自助录音带、辅助沟
通和灵媒侦探等)所宣称的主张,其实早已被证
明是错误的。本书提到的这些伪科学产业的存
在,助长了媒体对伪科学进行炒作式报道的趋
势。这种趋势对心理学的危害远比对其他学科的
危害要大,理解个中缘由,是学习如何正视心理
学的一个重要环节。
本书面向的不是即将成为心理学的研究者,而是面向一个更大的读者群——心理信息的消费
者。本书的读者对象是心理学初学者,以及那些
在大众媒体上得知一些心理学话题、又想知道如
何去判断这些信息的合理性的广大读者们。
本书不是一本标准的心理学入门教材,它没
有对心理学领域已取得的研究成果进行总结。事
实上,单靠到大学里选修一门心理学导论的课
程,对于纠正公众心中已经被媒体误导了的对心
理学的看法来说,可能并不是终极的解决方案。
因为众多对心理学抱有很大兴趣的非专业人士没
有时间、没有钱或是没有机会进入大学进行正规
的学习。更重要的原因是,作为一名大学心理学
的教师,我不得不承认我和同事们在大学里教心
理学时,也总是没能引导初学者对心理学这门科
学产生一个正确的认识。原因在于初级的课程设
置中通常没有包含对批判性分析思维技巧的训练,而这正是本书讨论的焦点所在。作为教师,我们常常只会忙于 将“研究发现”塞入教学内容当
中。每次我们在和学生讨论到诸如媒体眼中的心
理学等稍微偏离教学大纲的话题时,都会感到有
些内疚,并开始担心自己会不会因为跑题而不能
在学期结束前完成所有授课内容。
现在的心理学导论类教科书通常都有
600~800页厚,并且引用了数百篇已经发表的文
献。当然,包含如此丰富的材料并没什么错,至
少它反映了心理学知识在不断增长。然而不幸的
是,负面效果也同时存在。教师们常常只忙于给
学生灌输一大堆的理论、事实和实验,而没时间
去关注那些会被学生带入心理学研究的基本问题
及错误观念。这主要是因为教师们(包括入门类
教科书的作者)想当然地认为,只要学生接触了
足够多的心理学研究,自然就能从中推导出问题
的答案。简而言之,他们希望学生可以从对心理
学各领域实证研究的讨论中,自行挖掘出各类问
题的隐含答案,但是这类希望往往都落空了。到
这门课的最后复习阶段或学期结束之前,教师们
才无比震惊和沮丧地发现,学生提出的一些问题
及说法,是他们在课程开始第一天就应该提出来
讨论的,而不是在14周之后。比如:“既然心理
学实验不同于现实生活,那么它们能告诉我们什
么呢”、“心理学能像化学那样成为一门真正的科学吗”、“可是,我在电视上听一位心理大师讲的
正好与我们教科书上说的相反”、“我认为这个理
论相当愚蠢,因为我弟弟的行为和这个理论所说
的截然相反”、“心理学不过是些常识”、“每个人
都知道什么是焦虑,何苦还要去定义它呢”、“心
理学不过是一堆观点而已”。对于很多学生来
说,仅靠思考书中的内容是无法为这些问题找到
答案的。在本书中,我将对这类问题和说法背后
的误区进行澄清。
不幸的是,研究发现,普通的心理学入门课
程并不能有效地纠正初学者对心理学所持的诸多
误解(Keith Beins, 2008; Kowalski Tayloer, 2009;
Standing Huber, 2003)。这一不幸的事实赋予了
本书以合理性。心理学学生需要批判思维方面的
正确指导,批判性思维能够使其对心理学信息作
出独立的评估。
即使若干年后学生们不再记得心理学入门课
程中的内容,但他们仍然可以运用本书所涉及的
基本原理去判断心理学的主张。即使埃里克森
(Erikson)的人生发展阶段论被忘得一干二净,他们也仍可以运用本书介绍的思维工具去辨别媒
体中出现的心理学信息的真伪。一旦掌握,这些
技能就可以成为终身受用的思维工具,帮助我们
去评判各种知识主张:首先,它将使我们能够对那些看似合理的事实做出一个初步和总体的判
断;其次,这些技巧提供了一些评估“专家”观点
可信度的标准。因为在复杂的社会中,人们对专
家观点依赖始终存在,在获取知识时,对专家观
点可信度的判断就变得尤为重要了。虽然这些批
判性思维技巧可运用于各个学科或知识门类,但
它们在心理学领域里尤其重要,因为此领域经常
被大众媒体所歪曲。
许多心理学家都对试图阻止心理学被歪曲的
努力持悲观态度。虽然这种悲观并非没有道理,但是这本类似“消费者指南”式的书源自一个信
念,那就是心理学家不能让这一问题成为一种自
我实现式的预言。
尽管我很高兴这本书能有多次再版的机会,但令人遗憾的是,本书存在的原因仍和本人当初
撰写本书第一版时完全一样。媒体对心理学的介
绍一如既往地是在误导大众,而学生在开始上心
理学入门课程时,还是带着与以往同样多的对于
心理学的误解。正因为如此,本书后续几个版本
的目标始终如前。这些目标也正在被越来越多心
理学教师所共享。斯坦福大学心理学家罗杰·夏佩
德(Roger Shepard)表达了与本书第一版写作初
衷相同的看法:“虽然大多数心理学的本科生或
许不会走上学术科研的道路,但我们仍然希望他们有能力去对那些不断出现在媒体上的片面、幼
稚、混乱及夸张的所谓社会科学‘发现’的报导作
出判断……那些广为流传、认为可以通过片面的
常识或更为糟糕的星相学之类的伪科学就能充分
理解人类行为和心理现象的谬论,势必向我们持
续发出挑战。”(Shepard, 1983, p.855)
批判性思维技能帮助人们更好地理解心理学
的主题,以及他们周围的世界所发生的事情。本
书将对此技能作一个简略的介绍。
第10版更新的内容
因为之前版本已经进行了章节重组,本书第
10版在结构上没有作很大的改动,各章节的内容
和顺序也保持原样。并且应评审者和读者的要
求,这一版与第9版篇幅相当。我更新和重写了
书中的许多例子(保留了读者反响最好的例
子),用最近的研究和主题替换掉了那些过时的
案例。本版最大的修订在于引用与本书所提及的
各种概念和实验相关的最新研究资料。因此,大
量新的引文出现在这一版中(确切来说是172条
新引文),读者可以获得有关样例和概念最新的
参考文献。本书一如既往会对批判性思维技能作简略介
绍,帮助学生更好地去理解心理学的主题。在过
去的15年里,大学里强调批判性思维技能的呼声
越来越高(Abrami et al., 2008; Sternberg, Roediger,Halpern,2006)。的确,美国一些州立大学系统
已经进行了以加强批判性思维教育为目的的课程
改革。与此同时,也有其他教育学学者认为,批
判性思维技能不应该脱离特定的学科内容。而
《这才是心理学》正好融合了这两种取向,在帮
助教师教授丰富的现代心理学知识的同时传授批
判性思维的技巧。
欢迎读者们将对本书的意见发送到以下邮
箱:Keith.stanovich@utoronto.ca.Chapter 1
心理学充满生机:在科学阵营里
左右逢源
弗洛伊德问题
在大街上随便拦住100个人,请他们说出一
个健在的或已故的心理学家的名字,然后记下他
们的答案。毫无疑问,他们提到的会是菲尔博士
(Dr. Phil)、韦恩·戴尔[1]
(Wayne Dyer)以及其
他一些“媒体心理学家”。如果我们把这类媒体和
通俗心理学家排除在外,只考虑那些对心理学作
出过卓著贡献的心理学家,那么这项非正式小调
查的结果就几乎没什么悬念了——西格蒙德·弗洛
伊德会名列榜首,B. F. 斯金纳可能会屈居次席,但得票数会远远落后于弗洛伊德。任何其他心理
学家都缺乏足够的知名度来撼动这两位的地位。
因此,可以说弗洛伊德和那些在媒体上频频露脸
的通俗心理学共同定义了公众心目中的心理学。
弗洛伊德的声名远播,极大地影响了普通公
众对心理学的理解,同时也造就了诸多认识上的
误区。例如,许多刚入门的心理学学生会惊讶地
发现,如果对美国心理学会(APA)会员中所有
认同弗洛伊德精神分析的人数进行一下统计,他
们的人数居然没有占到会员总数的10%。在另一
个主要的心理学组织美国心理协会(APS)中,这一比例也绝不会超过5%(Engel, 2008)。有一
本受欢迎的心理学入门教科书(Wade Tavris,2008),在其超过700多页的篇幅中,只有15页
内容提到弗洛伊德或精神分析学派,而且这15页
中经常出现的是对其的批判(“大多数弗洛伊德
的观点都曾经并且现在依旧被大多数实证取向的
心理学家排斥”,p.19)。
简而言之,现代心理学并没有像媒体和一些
人文学科那样被西格蒙德·弗洛伊德的理论所左
右,也没有被其限定。在现代心理学家所关注的
大量研究主题、数据和理论中,弗洛伊德的工作
只占其中极小的一部分,在这些研究和理论中占
更大比重的则是5位诺贝尔奖得主所做的工作:大卫·胡贝尔(David Hubel)、丹尼尔·卡尼曼
(Daniel Kahneman)、赫伯特·西蒙(Herbert
Simon)、罗杰·斯佩里(Roger Sperry)和托斯腾
·维瑟(Torsten Wiesel)以及美国国家科学基金的
前负责人理查德·阿特金森(Richard Atkinson)的
贡献。然而,这些人的名字对公众来说却相当陌
生。
弗洛伊德对于现代心理学的重要性被无限地
夸大了,这事儿已经足够糟糕了。更糟的是,弗
洛伊德的调查方法完全不能代表现代心理学家是
如何进行研究的。事实上,弗洛伊德式的研究方
法彻底误导了人们对心理学研究的印象。例如,弗洛伊德并不采用控制实验,而我们将在第6章
讲到,控制实验是现代心理学家“兵器库”中最有
力的武器。弗洛伊德认为,个案研究足以证明理
论的真实或谬误,在第4章中,我们将谈谈这一
理念为何是错误的。正如一位心理治疗领域的史
学家所说的那样,如果弗洛伊德本人是一名科学
家,那么他所宣扬的是一门很奇怪的科学……精
神分析包含理论和假设,但是缺少实证观测的方
法(Engel, 2008, p.17)。
最后,弗洛伊德的工作中最大的问题是理论
和研究数据的联系。正如我们将在第2章看到
的,对于一个科学理论来说,理论和研究数据的联系必须满足一些标准,而弗洛伊德的理论常常
不能满足这些标准(Dufresne, 2007; Engel,2008)。简而言之,弗洛伊德根据他得到的数据
(个案研究和内省)建立了一套精细的理论,而
这些数据并不足以支撑此理论;他专注于构建复
杂的理论构架,但并没有像许多现代心理学家那
样,保证这些理论建在可靠、可重复的因果关系
之上。总之,人们对于弗洛伊德式的工作太过熟
悉,这严重阻碍了他们对现代心理学的正确理
解。
在这一章中,我们将采用两种方法来解
决“弗洛伊德问题”:首先,当我们展示现代心理
学的多样性时,就能非常清楚地了解到弗洛伊德
的工作所占的比重其实是很小的;其次,我们将
讨论一下,在广泛而多样的心理学研究中,哪种
特征是最为普遍的。有关弗洛伊德工作的那种过
时的认识遮蔽了普通大众的双眼,使之无法看到
现代心理学所共有的唯一而普遍的特性:用科学
的方法去寻求对行为的理解。
注释
[1]这两位是活跃于美国媒体的所谓心理学家的代表,他
们这类人通常有着丰富的媒体经验,有广泛的受众,但他们
没有受过严格的学术训练,不被真正的心理学学术团体认可,所传播的往往是一些似是而非的心理学知识。——译者
注现代心理学的多样性
事实上,现代心理学包含了大量不同的内容
和观点。这种多样性使得作为一门学科的心理学
显得不那么浑然一体。美国心理学基金会杰出教
学奖得主亨利·格雷特曼(Henry Gleitman, 1981)
将心理学描述为“一个松散地联合在一起的学术
王国,它横跨了生物科学和社会科学两个领
域”(p. 774)。心理学圈以外的人批评这种多样
性。例如,人类学家克利福德·格尔茨(Clifford
Geertz, 2000)抱怨道:“至少从外部来看,心理
学不像是一个单一的领域,能够像通常那样被分
为学派和专业。它看起来像是不同的、不相关的
调查方法的大杂烩,这些调查之所以能够归为一
类,是因为它们都以这样或那样的方式探究所谓
心智功能。”(p.187)
心理学有着令人惊叹的广泛性和多样的调查
方法,知道这一点对于理解心理学的本质至关重
要。可以简单列举一些具体指标来证明这一点:美国心理学会(APA)有56个分支机构,每个分
支都代表了一个特定的研究或应用领域(见表1
—1)。从表1—1中,你可以看到心理学研究主
题、研究背景和研究方法的丰富性和多样性。另
一个大型心理学组织——美国心理协会(APS)
也同样分支众多。其实,表1—1对于心理学领域
的多样性的描述还是较为保守的,因为它给我们
造成了一种印象,即每个分支都是一个特定的专
业领域。事实上,56分支机构中的每一个都是非
常宽泛的研究领域,包含更小的不计其数的分
支。简而言之,要穷尽心理学领域主题的多样性
是非常困难的。
表1-1 美国心理学会(APA)的分支机构
1.普通心理学(General Psychology)
2.心理学教学(Teaching of Psychology)
3.实验心理学(Experimental Psychology)
5.评价、测量和统计(Evaluation,Measurement, and Statistics)6. 神经行为科学和比较心理学(Behavioral
Neuroscience and Comparative Psychology)
7.发展心理学(Developmental Psychology)
8.人格和社会心理学(Personality and Social
Psychology)
9.社会问题的心理学研究(Psychological
Study of Social Issues)
10.审美、创造力及艺术心理学(Psychology
of Aesthetics, Creativity, and the Arts)
11.临床心理学(Clinical Psychology)
12.应用咨询心理学(Consulting Psychology)
13.工业和组织心理学(Industrial and
Organizational Psychology)
14.教育心理学(Educational Psychology)
15.学校心理学(School Psychology)
16.理论咨询心理学(Counseling
Psychology)17.公共服务中的心理学家(Psychologists in
Public Service)
18.军事心理学(Military Psychology)
19.成人发展与老龄化(Adult Development
and Aging)
20.应用实验和工程心理学(Applied
Experimental and Engineering Psychology)
21.康复心理学(Rehabilitation Psychology)
22.消费者心理学(Consumer Psychology)
23.理论和哲学心理学(Theoretical and
Philosophical Psychology)
24.行为分析( Behavior Analysis)
25.心理学史(History of Psychology)
26.社区心理学(Community Psychology)
27.精神药理学和药物依赖
(Psychopharmacology and Substance Abuse)28.心理治疗(Psychotherapy)
29.心理催眠(Psychological Hypnosis)
30.国家心理学常务联合会(State
Psychological Association Affairs)
31.人本心理学(Humanistic Psychology)
32.智力缺陷和发展性障碍(Mental
Retardation and Developmenta Disabilities)
33.人口与环境心理学(Population and
Environmental Psychology)
34.女性心理学(Psychology of Women)
35.宗教心理学(Psychology of Religion)
36.儿童、青少年和家庭服务(Child, Youth,and Family Services)
37.健康心理学(Health Psychology)
38.心理分析(Psychoanalysis)
39.临床神经心理(ClinicalNeuropsychology)
40.心理学和法律(Psychology and Law)
41.独立从业的心理学者(Psycholigists in
Independent Practice)
42.家庭心理学(Family Psychology)
43. 男女同性恋及双性恋的心理学研究
(Psychological Study of Lesbian, Gay, and Bisexual
Issues)
44.少数民族的心理学研究(Psychological
Study of Ethnic Minority Issues)
45.媒体心理学(Media Psychology)
46.锻炼和运动心理学(Exercise and Sport
Psychology)
47.和平心理学(Peace Psychology)
48.团体心理学和团体治疗(Group
Psychology and Group Psychotherapy)
49.成瘾(Addictions)50.男性和男性化的心理学研究
(Psychological Study of Men and Masculinity)
51.国际心理学(International Psychology)
52. 临床儿童心理学和青少年心理学
(Clinical Child Psychology and Adolescent
Psychology)
53.幼儿心理学(Pediatric Psychology)
54.药物疗法(Pharmacotherapy)
55.创伤心理学(Trauma Psychology)
注:没有分支4和11。
多样性的含义
许多人学习心理学是希望能够学到一套宏大
的心理学理论,以此来概括和解释人类行为和意
识的方方面面。但这类愿望总是会落空,因为构
成心理学的不是一整套宏大的理论,而是许许多
多不同的理论,每个理论仅仅能够解释行为的有限方面(Griggs, Proctor, Bujak-Johnson, 2002)。
心理学的多样性使得理论整合变得极为困难。事
实上,在许多心理学者看来,“整合”本身就是“不
可能的任务”。尽管如此,另外一些心理学家却
正在寻求领域内的理论整合(Cacioppo, 2007a,2007b; Cleeremans, 2010; Gray, 2008; Henriques,2011; Sternberg, 2005)。例如,在过去的20年
间,心理学的学科统一性有所增强,这要归功于
进化心理学家的努力。这些研究者将人类心理过
程视为服务于某些重要进化功能(诸如亲缘关系
识别、择偶、合作、社会交换及后代抚养等)的
机制(Buss, 2005, 2011; Cartwright, 2008; Ellis
Bjorklund, 2005; Geary, 2005, 2008),并试图以此
来实现概念的整合。卡乔波(Cacioppo, 2007b)
同样也指出,像社会认知神经科学这样的分支,将心理学中的大量专业如认知心理学、社会心理
学和神经心理学紧密地联系在一起。
一些研究者认为心理学的多样性反映了学科
的潜在优势(Cacioppo, 2007a; Gray, 2008)。例
如,卡乔波(Cacioppo, 2007a)将心理学视为所
谓的“枢纽学科”——会对其他领域产生广泛影响
的学科。他引用证据表明,和其他科学相比,心
理学的发现有着更深远的影响。然而,无论心理
学家对心理学主题的统一性持何立场,他们都承
认,即便有一天能够实现理论的整合,其过程也是极为困难的。缺乏理论的整合为心理学招来了
一些批评,贬低了它作为科学所取得的进步。这
类批评源于一个错误的观念,即所有真正的科学
都必须具备一个宏大的、统一的理论。之所以说
它错误,是因为它忽视了其他科学同样也缺乏一
个完备统一的概念体系这个事实。哈佛大学心理
学家威廉·艾斯特斯(William Estes, 1979)已经
强调过这一点:
实验心理学家所面临的这种困境既不新
鲜,也非独有。20世纪早期,物理学在本科
水平的教学中便被分成了若干独立学科。因
此,我是通过分别学习力学、热力学、光
学、声学和电学而了解这门科学的。同样,化学也曾被分为无机化学、有机化学、物理
化学和生物化学。当时这些分支之间的交流
和融合并不比现在的心理学好到哪里去。它
们都仅仅在抽象的数学理论水平上才实现了
整合。医学也被分为众多分支,而且和心理
学一样,没有新的整合出现(pp. 661-
622)。
一旦我们知晓了决定某一门学科结构的社会
和历史因素是怎么回事,就能认识到,要求所有
领域具备高度统一性是不合逻辑的。事实上,许
多学者认为“心理学”这个暗示学科内容具有统一性的词汇并不能反映学科的特性。其结果就是,许多美国的知名大学的学院已经把它们的名字改
为心理科学学院(Department of Psychological
Sciences)(见Jaffe, 2011)。“科学”这一术语承
载了本章的两个重要信息:其一是多元化标志,即我们讨论过的这个学科内容的多样性的观点;
其二“科学”这一词汇也标志着,应该从方法而非
内容上去寻找心理学这门学科的统一性。只有这
样,我们才有望从不同研究者的研究目的中发现
更多的统一性。但即使是在方法领域,也依然存
在着有关这门学科的一些很深的误解。科学的统一性
仅说心理学是关于人类行为的科学,并不能
将它和其他学科区分开来。许多其他专业团体和
学科——包括经济学家、小说家、法律、社会
学、历史、政治科学、人类学和文学研究——都
或多或少与人类行为有关,心理学在这方面并非
独树一帜。
应用性也不能证明心理学具有任何独特性。
例如,许多大学生选择主修心理学是因为他们有
一个要帮助他人的崇高目标。但是在许多领域,如社会工作、教育、护理、职业咨询、物理治
疗、警事科学、人力资源以及语言矫正等,“帮
助他人”都是其中的重要组成部分。同样,培训
应用性的、通过咨询来帮助他人的专业人才并不
需要单独开辟一门叫做“心理学”的学科。
只有两点能证明心理学是一门独立的学科:
其一,心理学研究采用科学方法来探究人类及动
物的所有行为;其二,从这一知识衍生出的实际应用是具备科学基础的。如果不是这样,心理学
就失去存在的理由了。
心理学不同于其他行为研究领域的地方在
于,它试图向公众保证两点:第一,心理学中有
关行为的结论都有科学证据;第二,心理学的应
用都源于科学方法,并经过了科学方法的检验。
心理学是否曾经偏离过这两个目标呢?有过,而
且经常如此(Lilienfeld, 2007; Lilienfeld, Ruscio,Lynn, 2008)。本书就是关于怎样更好地实现这两
个目标的。在第12章中,我将回到这一主题——
一些心理学工作者因为不遵守适当的科学标准而
自我损害了其作为心理学家的合法性。但是,从
原则上讲,科学性正是保证心理学作为一门独立
学科的标准。如果有朝一日心理学不再追求这些
目标,即它不再愿意坚守科学标准,那它也就该
关张大吉,将其关注的领域拱手让给先前提到的
那些学科——因为此时它已成为了一个完全多余
的知识领域。
毫无疑问,任何人想要理解心理学,第一步
也是至关重要的一步,就是要意识到心理学的首
要特征——它是有关行为的、以数据为基础的科
学研究。对这一事实及其全部内涵的理解将贯穿
本书的始终,因为这是我们认识真正心理学的最
基本的途径。反过来说,人们之所以对心理学的理解会出现各种各样的偏差,正是因为未能意识
到它是一门科学的学问。例如,我们常常会听到
学术圈外的人宣称心理学不是科学。为什么还会
有这样的误解?
那些想让公众相信“心理学不能成为一门科
学”的企图,其产生的背景各不相同。正如我们
在后面的章节中所要讨论的,许多有关心理学的
错误认识,都是由那些伪心理学的代理人处心积
虑制造的。在我们的社会中,一个经营伪科学信
念系统的巨大产业正在兴起,这一信念系统出于
既得利益的考虑,总是想让大众相信,无论什么
都能纳入心理学的范畴,而且心理学的主张不能
以理性标准来衡量。这无疑为“催眠减肥”、“激发
潜在心灵能量”、“睡觉时学法语”这类广告以及利
润高达数百万的“心理自助”产业里其他诸多门道
的营销创造了绝佳的氛围。此类门道要么不是建
立在科学证据基础上,要么(在许多时候)与已
有的证据相冲突。
另一种对于科学心理学的排斥是由于一些人
不愿看到科学进入到长期以来由不容置疑的权威
或“常识”统治的领域里。历史上此类例子不胜枚
举——人们拒绝使用科学,而更喜欢利用哲学沉
思、神学谕告或世俗智慧去解释现实世界。每一
门科学都会经历过一个受到阻碍的阶段。与伽利略同时代的知识分子拒绝透过他的新望远镜观察
天空,因为“木星存在卫星”颠覆了他们的哲学和
神学信仰。几个世纪以来,人类解剖学的发展可
谓步履蹒跚,因为世俗和宗教禁止对人类尸体进
行解剖(基督徒认为,身体的内部是“上帝的辖
区”,见Grice, 2001)。查尔斯·达尔文总是受到
不断的抨击。保罗·布洛卡(Paul Broca)的人类
学协会(Society of Anthropology)在19世纪的法
国受到抵制,因为有人认为关于人类的知识会颠
覆国家。
关于人类的知识每向前迈进一步,都会引发
反抗。然而,当人们开始意识到科学并没有通过
调查和研究对人性造成亵渎,而是以扩展知识的
方式促进了人类的自我实现时,反抗终将烟消云
散。谁现在还认为星系图以及宇宙是由无数星球
所组成的复杂理论会摧毁我们对于宇宙的向往?
谁会选择禁止人体解剖时的医疗保健系统,并进
而拒绝从社区中获得的现代医疗保健?对于星球
和人类身体的实证性态度并没有磨灭人性。更近
的例子是,达尔文的进化论体系为遗传学和生物
学取得非凡的进步奠定了基础。但是,在我们更
接近人类的本质及起源的同时,残余的反抗势力
仍然存在。在美国,一些政客继续施压,意欲在
公立学校推行“神创论”教学;同时调查显示,有
很大比例的美国人(欧洲和加拿大人亦如此)并不接受“人类是经过自然选择进化而来的”这一科
学事实(Barnes, Keilholtz, Alberstadt, 2008;
Frazier, 2009, 2010; Laden, 2008)。进化生物学有
着无数辉煌的科学成就记录,时至今日还是照样
被公众所排斥。如此看来,心理学这门志在将所
有关于人类的固有信念都置于科学检验之下的新
兴科学,时下还会引发人们对其正确性的否定,这又有什么好奇怪的呢?那么,什么是科学
为了理解什么是心理学,我们必须理解什么
是科学。或许我们可以从“什么不是科学”入手。
按这种方法,我们能摒弃大部分常见的错误观
念。首先,科学并不是由内容来定义的。宇宙万
物的任何方面对于一门科学学科的发展来说,都
是一场公平的游戏,当然也包括人类行为的所有
方面。我们不能将宇宙万物分为“科学的”和“非科
学的”两类。尽管历史上始终有一股强大的力
量,试图将人类排除在科学研究的范围之外,但
正如我们所见,它们均以失败告终。拒绝将心理
学作为一门科学学科来对待,可能代表了这一历
史争论的余音。
科学也不能按照特定实验器材的使用来定
义。试管、电脑、电子设备或研究者的白大褂都
定义不了科学。这些都是科学的附属物而不是其
本质特征。科学是一种思考和观察事物以便深入
理解其运行机制的方法。在本章的剩余部分,我们将讨论科学的三个
相互关联的重要特征:(1)应用系统的实证主
义;(2)产生公共知识;(3)验证可解决的问
题。尽管我们将逐一检验每一条特征,但请记住
这三条特征构成了相互联系的统一整体(更多有
关科学的普遍特征的详细讨论,参见书后参考文
献部分列出的Bronowski、Cournaud、Medawar、Popper、Raymo以及Sagan的著作)。
系统的实证主义
如果在任何辞典中查找“实证主义”,你会发
现它的意思是“基于观察的实践”。科学家通过验
证来找寻世界的规律。这个事实可能对你来说是
显而易见的事实,而这正是过去两个世纪以来科
学态度传播的结果。在过去,它却不是显而易见
的。回想一下伽利略的例子,伽利略借助他那原
始的望远镜,宣称看见了环绕木星的一些卫星。
而在当时,有学识的人们都认为只存在七个“天
体”(五颗行星、太阳、月球)。长久以来,人
们认为获得知识的最佳途径是纯粹思考或诉诸权
威。一些同时代的学者甚至拒绝透过伽利略的望
远镜进行瞭望。还有一些人认为望远镜是设计用
来骗人的。更有一些人指责说望远镜是在地面上而非天空中工作(Shermer, 2011),另外一位叫
弗朗西斯科·西奇(Francesco Sizi)的学者试图驳
倒伽利略,但他并不是通过观察,而是通过下面
的一番话:
人的脑袋上有七个窗口:两个鼻孔,两
只耳朵,两只眼睛和一张嘴;因此在天界有
两颗吉星,两颗灾星,两颗发光星(指日
月),以及性状不明但无关紧要的水星。从
这点和其他无数相似的自然现象诸如七种金
属等中,我们就可以归纳出行星必然是七
个……除此之外,犹太人和其他古老的民
族,都将一周分为七天,并以七大行星来命
名;如果现在我们增加了行星的数目,将导
致整个系统的崩溃……进一步来说,卫星用
肉眼无法看到,因此对于地球没有影响,既
然没有用处,也就不存在(Holton
Roller, 1958, p. 160)。
关键问题不在于以上论述多么愚蠢可笑,而
在于它被视作可与真实观察抗衡的一种辩驳。今
天我们嘲笑它是因为我们都是事后诸葛亮。三个
世纪以来,业已证明力量的实证取向使我们强于
可怜的西奇。要是没有经历这些实证主义的岁
月,我们中的许多人可能都会点头同意并对他大
加褒奖。的确,实证取向并不一定显而易见,这就是为何即使在一个科学占统治地位的社会中,我们也不得不经常强调它的原因。
纯粹、单一的实证主义还不够。注意本小节
的标题是“系统的实证主义”。观察很好,而且很
有必要,但是对于自然世界单纯的、非结构化的
观察并不能导致科学知识的产生。假使你记录下
自己一天中从起床到睡觉之间观察到的所有情
况,完成这一任务时,你会拥有一大堆事实,但
仅凭此并不能让你更好地理解这个世界。科学观
察被称为“系统性的”,是因为它是结构化的,所
观察的结果能够揭示自然世界一些潜在的本质。
科学观察通常都是理论驱动的;它们检验有关世
界的各种不同解释观点。它们是结构化的,因此
可以根据观察结果,决定哪些理论得到支持而哪
些则被拒绝。
公共性的、可检验的知识:可重复性和
同行评审
从某种特殊意义上说,科学知识是公共性
的。当然,并不是说把科学发现张贴在社区中心
的公告牌上就叫“公共性”了。我们指的是这样一
个事实,即科学知识并不单独存在于特定个体的头脑之中。从某种重要意义上说,科学知识在没
有提交给科学团体、接受他人批评和验证之前,是根本不存在的。那些被认为隶属于特定个体思
维过程中、不可接受他人审查和批评的“特殊”知
识,永远都无法获得科学知识的地位。
科学通过可重复性来实现其公共可检验性的
理念。一项发现如果想在科学界获得公认,就必
须以一种能够让其他科学家尝试相同实验并获得
相同结果的方式呈现给科学团体。当这一切都完
成,我们就可以说,这一发现是可重复的。科学
家利用可重复性来定义公共知识。可重复性保证
了特定发现并不是由于个别调查者的错误或偏差
而产生的。简而言之,一项发现如果想要被科学
团体所接受,它必须能够被原始调查者以外的其
他人所重复。当一项发现以这种方式被呈现出来
时,它就成为了公共性的。它不再仅仅为原始研
究者个人所有,它还能够被其他人获取、扩展、批评,或以他们的方式得到应用。
诗人约翰·唐尼(John Donne)告诉我们“任
何人都不是一座孤岛”。在科学中,没有一个研
究者是一座孤岛。每个研究者都与科学团体及其
知识基础相联系。正是这种相互联系使得科学累
积性地发展。研究者不断在原有知识的基础上进
行新的探索,力求超越已知。而这一过程的前提便是,先前的知识以一种适当的方式予以陈述,使任何研究者都能以之为基础来进行探索。
公共性的、可检验的知识,指的是我们可以
将研究发现递交给科学团体,团体中的任何人都
能对其进行重复检验、批评或拓展。这个标准不
仅对于科学家,同时对于作为消费者的外行人来
说也是最重要的,因为他们必须对来自媒体的科
学信息进行评估。正如我们将在第12章所看到
的,区分大搞伪科学的江湖术士和真正的科学家
最主要的一个方法就是,前者常常避开科学出版
的常规渠道,而选择直接通过媒体公开他们
的“发现”。当公众面对真实性可疑的科学发现
时,一个屡试不爽、颠扑不破的标准就是,考察
这些发现是否在得到认可的科学期刊上发表过以
及是否经过了同行评审。对这一问题的回答往往
能够区分“李鬼”和“李逵”。同行评审是指每一篇
投到研究性期刊的文章都要经过数位科学家的评
审,并将批评意见提交给编辑(通常都是此期刊
所覆盖的某一领域中有资深研究经历的专家),再由编辑权衡这些意见,确定这篇文章可以立即
发表,还是需进一步实验研究和统计分析之后再
发表,或是因为有缺陷或价值太低而拒绝接受。
大多数期刊在每期中都刊有编辑条例说明,因此
很容易知道此期刊是否经过同行评审。并非所有经过同行评审的科学期刊中的信息
都必然正确,但至少它已满足了同行批评和监督
的标准。同行评审是一个最低标准,而非严格的
标准,因为大多数学科领域中都会有几十种质量
参差不齐的期刊。大部分科学观点在满足一些基
本标准的前提下,都可以在某些地方以正规的方
式出版。那种认为只有很小部分的数据和理论才
能够在科学界获得出版的观点是错误的。当一些
心理救助或治疗方面的江湖术士试图说服媒体和
公众时,往往会暗示,一种所谓“正统科学”的阴
谋将他们排除在科学出版渠道之外。但是,稍微
想一想,心理学领域中有多少这样的合法渠道
啊!APA的数据库 《心理学文摘》(PsycINFO)
收录了来自2000种不同期刊的文献,其中大部分
期刊都有同行评审。几乎所有待检验的理论和实
验都能在如此众多的出版物中找到自己的发表渠
道。
再次强调,我不认为所有发表在具有同行评
审机制的期刊上的所有观点都必然正确。相反,正如我先前所强调的,发表只是一个最低的标
准。然而关键在于,任何一种理念、一个理论、一项主张或疗法如果不能在有同行评审的学科文
献中获得适当的收录,问题就很明显了。尤其是
当某一主张缺乏证据却伴随着媒体的宣传活动
时,此理念、理论或疗法显然是骗人的。例如,2005年美国宾夕法尼亚州有一桩著名的诉讼,有
人试图在学校的生物课上教授神创论,鼓吹智力
设计(神创论的一种形式)理念的一个证人说,他很难举出任何一个经过同行评审的有关智力设
计的研究,尽管这一运动已经兴起了十年有余
(Talbot, 2005, p.68)。
同行评审机制在不同学科之间有所区别,但
是根本理念是相同的。同行评审是科学将客观性
和公开评议标准制度化的一种方法(另一种是重
复验证)。观点和实验要提交给其他评估,经过
一个仔细推敲的过程。只有通过这一严格过程的
观点才算符合了公共验证的标准。同行评审程序
绝非完美,但它对我们消费者来说是唯一的保护
机制。忽略它就等于让我们自己被巨大的伪科学
产业玩弄于股掌之间,而这一产业又极其善于操
纵媒体来达到自己的目的(见第12章)。在随后
的章节中,我们将更详尽地讨论,如果忽视这些
心理科学实践中固有的审查与制衡,我们将要付
出多么高昂的代价。
实证可解的问题:科学家对于可检验理
论的研究科学针对的是可解决的、明确具体的问题。
这意味着就其类型来说,科学家们所致力解决的
问题是能通过现有的经验技术获得答案的。如果
在当前所掌握的经验技术条件下,问题无解或理
论不可验证,科学家们将不会对它展开研究。例
如,“在日托期间,给予结构化语言刺激的3岁儿
童,与那些没有给予这些额外刺激的儿童相比,是否可以更早地做好接受阅读指导的准备”就是
一个科学问题,因为在现有的经验方法之下,这
是一个可解的问题。“人性本善还是本恶”就不是
一个可实证的问题,因此不属于科学领域。“生
命的意义是什么”同样也不是实证问题,因此也
不属于科学领域。
科学通过以下方式得以进步:提出理论解释
世界中的特定现象,根据这些理论作出预测,实
证地检验这些假设,基于检验的结果对理论进行
修正,通常次序为:理论→预测→检验→修正。
因此对于科学家来说,“可解问题”这个词的意义
通常是“可验证的理论”。什么样的理论才算是“可
验证”的呢?这一理论必须与真实世界中可观察
的事件具有特定的关联;这就是“实证可检验”的
含义。可检验性标准在学术上通常被称为“可证
伪标准”,这也是本书第2章的主题。
我们说科学家解决实证可解问题,并不是说在不同类别的问题中,有的本质上是可以解决
的,而有的则注定无法解决,并且这种区分是固
定不变的。恰恰相反,有些当前无法解决的问
题,在理论和经验技术更加进步的时候会成为可
解的。例如,20年前,对于“托马斯·杰斐逊是否
与其奴隶萨丽·海明斯生下了她的某个孩子”这一
争议话题,不会有历史学家认为它是一个实证可
解的问题。然而到了1998年,由于基因技术的进
步,这个问题已成为可解的,发表在《自然》
(Nature)杂志的一篇文章(Foster et al., 1998)
指出,杰斐逊极可能是埃斯顿·海明斯·杰斐逊的
父亲。
这就是科学得以发展而新的科学得以诞生的
方式。但对于“当前什么是可解的”这一问题,总
是存在巨大分歧。因为涉及特定问题时,科学家
们自己在这点上的意见都难以统一。因此,尽管
所有科学家都认同可解性标准,但是他们对其特
定应用可能存在不同的意见。诺贝尔文学奖得主
彼得·密达沃(Peter Medawar)就曾把他的一本
书定名为《可解的艺术》(The Art of the Soluble,1967),并在书中指出,科学的一部分创造力就
在于寻找处于人类知识最前沿、并可以用实证技
术加以解决的问题。
心理学本身就提供了许多从无解到可解的好例子。有许多问题,诸如“一个孩子如何获得其
父母的语言”、“为什么我们会忘记我们曾经知道
的事情”、“身处一个群体中会如何改变一个人的
行为和思想呢”等,在人们意识到可以以实证的
方法来解答之前的几个世纪里,都只能被猜想而
已。随着这一认识的慢慢发展,心理学逐渐集合
了来自各个领域中关于行为的各种问题。心理学
科逐渐脱离哲学,并成为了一门独立的实证科
学。
认知心理学家史蒂芬·平克(Stephen Pinker,1997)讨论了“未知”可以划分为“问题”或“玄
谜”。如果是“问题”,我们知道其答案是能找到
的,即使我们目前还没有答案,我们也知道它大
概是什么样子。如果是“玄谜”,我们甚至不能想
象答案可能会是什么样子。利用这些术语,我们
可以看到,科学就是将玄谜变为问题的过程。事
实上,平克(1997)指出,他之所以要写《思维
的运作》(How the Mind Works)这本书,正是
因为“从心理表象到浪漫的爱情,几十个心理和
思维方面的玄谜最近已经升级为问题了”(p.
9)。心理学和世俗智慧:“常识”的误
区
我们每个人都有一套内隐的有关行为的模
型,这些模型影响着我们的互动以及我们如何看
待自己和他人。事实上,一些社会、人格和认知
心理学家正在探究这些内隐的心理学理论的本
质。我们很少会清晰并有逻辑地表达我们的理
论。相反,我们通常只有在特意关注它们,或者
发现它们正遭遇某种挑战时,才会意识到其存
在。其实,我们个人的行为模型并不像真正的理
论那样具有内部一致性。相反,当我们觉得需要
对行为作出解释时,往往搬出一箩筐关于人类行
为的普遍真理、说教及谚语。这些关于行为的常
识存在一个问题,它们之中有不少是自相矛盾
的,因此也是不可证伪的(证伪原则是第2章的
主题)。
人们爱用一些民间谚语来解释行为事件,即
使之前在解释同一类型的事件时曾用过与之完全矛盾的谚语。例如,我们中的大多数人都听到或
说过“三思而后行”——若不是我依稀记得之前有
人告诫说“该出手时就出手”,我还会觉得这是个
有用的、直接的行为建议呢!“小别胜新婚”明确
预测了一种对于事件的情绪反应,但“眼不见,心不烦”不也同样如此吗?如果“欲速则不达”,那
为什么有时我们又听到“时不我待”?既然“三个臭
皮匠,顶个诸葛亮”,为什么又说“三个和尚没水
吃”?如果我认为“行走江湖,安全第一”,为什么
也相信“不入虎穴,焉得虎子”?如果“异性相
吸”,为什么又“物以类聚”?我劝许多学生“今日
事今日毕”,但我希望没跟我刚刚指导过的那个
学生说过这番话,因为我刚还跟他说“要顺其自
然”。这类谚语和俗话构成了对行为的固有“解
释”,人们爱用它们,就是因为它们难以驳倒。
不管发生什么事,可以拿一条出来解释一番。难
怪我们都认为自己是判断他人行为和人格的高
手。天底下发生的事我们都能解释。世俗智慧的
可鄙之处就在于,它们压根不承担被驳倒的风
险。
世俗智慧属于“后见之明”的智慧,并且它在
真正预测性的意义上是无用的,这也就是为什么
邓肯·沃茨(Duncan Watts)将他的一本书命名为
《一切都显而易见:一旦你知道了答案》
(Everything Is Obvious: Once You Know theAnswer)(2011)。沃茨论述了拉扎斯菲尔德
(Lazarsfeld)的一篇经典文章(1949),60多年
之前,拉扎斯菲尔德在应对“社会科学不能告诉
我们不知道的任何事情”这一普遍的批评时,他
列举了对600000名参加第二次世界大战的士兵进
行调查后得到的一系列发现,例如,农村背景的
士兵在服役期间比城市背景的士兵有更好的精神
风貌。人们可能会倾向于认为所有的这些调查结
果都显而易见。但是让我们以这个结果为例:人
们倾向于认为,显而易见,农村出来的人更加适
应严苛的物理环境,因此也肯定能更好地适应军
旅生活。其他类似的结果同样显而易见。接着拉
扎斯菲尔德使出了他的杀手锏:其实所有的发现
都与最初呈现的陈述观点完全相反。例如,事实
上,来自城市的士兵比来自农村的士兵在服役期
间有更好的精神面貌。最后一部分的内容是为了
让人们认识到,他们也能非常容易地对相反的结
果作出解释。如果一开始就被告知了真实的结
果,人们可能解释说他们认为城市的人已经习惯
了拥挤的环境和等级化的权威。人们可能永远也
不会意识到他们编造对相反的结果的解释是如此
容易。
所以说,有时我们内隐的心理理论不容反
驳。我们将在第2章中看到为什么这种不可反驳
性造成了理论的失效。然而,即使我们的世俗观念有一些特定用处,甚至是经验可证的,也会产
生问题。问题在于,心理学研究表明,在接受实
证检验后,许多关于行为的普遍文化信念都被证
明是错误的。
世俗观念(或称“常识”)出现谬误的例子俯
拾皆是。比如说,有一种说法是,学习好或读书
多的孩子都不擅长交际和体育。这个观点虽然错
得离谱,但在当今社会上极为流行。有大量证据
表明,与“常识”世俗观念正好相反,爱读书的人
和追求学术成就者与不读书者相比,有着更强健
的体魄,而且更常参与社交活动(Zill Winglee,1990)。再比如,学习成绩好的儿童比学习成绩
差的更容易被同伴接纳。读书多的人比不读书者
更愿意运动、慢跑、露营、远足、维修汽车等。
许多关于行为的世俗观念一经产生便生生不
息。例如,20世纪90年代风行于社会和学校的一
种世俗观念是,低自尊导致攻击行为。但实证研
究显示,攻击行为和低自尊并无关联
(Baumeister, Campbell, Krueger, V ohs, 2003,2005; Krueger, V ohs, Baumerster, 2008)。相
反,攻击行为似乎往往与高自尊相关同样。与之
相似,过去20年间有一个非常流行的假说认为,低自尊会导致学业不良的问题。事实上,自尊和
学业成绩之间的真实关系可能与教育工作者和家长的假设恰恰相反:是在校成绩(以及生活的其
他方面)的优秀导致了高自尊,而非后者引起了
前者。
考虑另一个常见的世俗观念——“孩子会给
父母带来幸福”。如果我们考虑退休后孩子会带
来的好处,这个陈述在一定程度上可能是对的。
人们回首往昔时,的确会发现孩子带来的幸福。
问题在于,人们常常混淆回忆的观点和对真实事
件的体验。从有孩子的例子看,两个观点是十分
不同的。在年老时,觉得有个孩子确实令人开
心。但是,就连续性、继时性的快乐(与追溯性
的回忆相反)来说,孩子实际上让人的快乐减
少。现在有一系列文献采用所谓“经验取样
法”(experience-sample)观察人们在不同时刻的
幸福程度(Brooks, 2008; Gilbert, 2006; Gorchoff,John, Helson, 2008; Lyubomirsky Boehm, 2010;
Wargo, 2007),研究发现了一系列的趋势,例如
结婚会增加幸福感。同时还发现,父母的幸福感
会随着第一个孩子的降生降低。当第一个孩子成
年时,幸福程度回弹一些,但随后又降低得更
多。只有当最小的孩子离家自立后,婚姻幸福感
才回归到没有孩子时的水平。
简言之,当世俗观念“孩子给父母带来幸
福”接受科学检验时,情况就变得复杂起来。只有从回溯性的角度看,当孩子终于离开家时,我
们可以品味将孩子抚养成人的成就感时,“孩子
带来幸福”才是正确的。但这与这个世俗观念通
常所表述的意思大相径庭。它通常指抚养孩子会
让你立刻或在近期感到幸福。这就是世俗观念的
惊人谬误之处。
世俗智慧是错误的另一个例子就是对学生来
说常见的劝诫:做多选题时,即使对所选答案感
到不确定,也千万不要更改最初的答案。不仅大
多数学生认为他们不应该更改不确定题目的答
案,而且《GRE巴朗指南》(Barron’s Guide to
GRE)也建议“当你决定更改答案时要极其谨
慎,经验表明更改答案的学生都会改
错”(Kruger, Wirtz, Miller, 2005, p.725)。这一
建议完全是错的,错误的原因是,世俗迷思有关
更改答案会降低一个人的分数的观点本身就大错
特错。实际研究表明,当对一个多选题的答案有
怀疑时,学生最好改变他们最初的选择(Kruger
et al., 2005; Lilienfeld, Lynn, Ruscio, Beyerstein,2010)。
世俗智慧大行其道的例子还有关于“我们只
用了10%的大脑功能”的世俗观念。虽然这一说法
完全缺乏认知神经的基础(Boyd, 2008; Lilienfeld
et al., 2010),但这一观念已流行了几十年,且俨然已成为所谓的“心理学公理”——即并不正
确,但是已经重复了无数遍,以至于普通人认为
就是事实的心理学观点。同样,一些人相信有些
人是“左脑型”,有些人是“右脑型”;或者说人格
的某些特定方面受左脑控制,另一些方面受右脑
控制。尽管现代神经科学研究确实显示大脑中的
一些功能专门化,但是对左右脑观点的这些通俗
化说法却是胡说八道,尤其是在发现我们的大脑
以联合的方式工作的情况下(Lilienfeld et al.,2010; Radford, 2011)。
世俗观念并不总对证据免疫。有时,当与之
矛盾的事实广为人知时,世俗心理学(“常识”)
也会改变。例如,几年前,一个广为流传的有关
儿童的俗语是“早熟者必早衰”(Fancher, 1985, p.
141)。这条俗语反映了“童年早熟与成年异常存
在关联”这一信念,这一信念得到了许多“小时了
了,大未必佳”的例子的支持。但在这件事上,心理学证据证明上述俗语并不准确,这一结论已
被大众文化所吸收,所以你以后几乎不大会再听
到这个世俗“智慧”了。
最后这个例子是一个警告,提醒我们注意当
下的“常识”,因为不难看出,昨日的常识往往变
成今天的谬论。毕竟,常识就是“尽人皆知的知
识”,对吧?对。那么,人人都知道妇女不能投票,对吧?非裔美国人不应该接受教育,对吧?
残障人士不该在社会里出现而应当被送到收容所
去,对吧?事实上,150年前,这些观念都是尽
人皆知的常识。当然,我们现在视这些过去的常
识为谬论,都是些以完全未经证实的假设为基础
的信念。但是,从这些例子中,我们可以看到心
理学在常识面前扮演的关键角色。常识总是基于
一些假设,而心理学对这些假设的经验基础进行
检验。正如我们之前看到的许多例子,有时候假
设得不到实证支持。这样的例子还有很多,通过
它们,我们可以看到,心理学扮演着一种世俗智
慧检验者的角色,常常难免和诸多根深蒂固的文
化信念发生冲突。心理学往往是“传递坏消息的
信使”[1]
,宣告原本为人们所接受的世俗观念再无
立足之地。这就不难理解,为什么许多人不仅无
视这些消息,还想消灭这些信使。
注释
[1]此处为“花剌子模信使”的典故,传说中亚古国花剌
子模有位国王,会奖赏带来好消息的信使,而处死带来坏消
息的信使。——译者注心理学是一门年轻的科学
建立在实证基础上的心理学始终存在反对意
见。仅仅100多年前,剑桥大学还拒绝建立一个
心理物理学实验室,因为这样的一个主题研
究,“以把人类的灵魂放在天平上的方式侮辱了
宗教信仰”(Hearst, 1979, p. 7)。心理学致力于
证明其问题是实证可解的,这一战斗也是最近才
取得胜利。不过随着科学的进步,心理学家将涉
足越来越多的主题,这些主题涉及人类某些牢固
的信念,而很多都是可以通过实证方法验证的。
心理学家现在正研究的话题性主题包括道德推理
的发展、浪漫之爱、种族偏见的性质以及宗教信
仰的心理和社会决定因素等。童年期性行为的研
究最近引发了很多争议(Lilienfeld, 2010; Rind,2008)。尽管有些人反对对这些领域进行实证调
查,但这些领域都取得了科学进展。
美国心理学会前任主席杰拉尔德·库彻
(Gerald Koocher, 2006)通过将他的一个首席专栏命名为“心理科学并不政治正确”来提醒我们有
关心理学性质的问题。在文章中,他讨论了一些
研究主题,例如肥胖的原因、决定政治态度的因
素、宗教和性行为的关系、家庭暴力等。他指出
这些标题下的研究结果都是有争议的,但是“心
理科学不能被社会自由派或保守派制定的政治正
确的标准所挟持”(p. 5)。
作为一门学科,心理学总是处于一种两难境
地:一方面,一些人反对把心理学称为科学,否
认心理学家可以建立关于行为的实证理论;另一
方面,另一些人则由于惧怕心理学在某些行为领
域揭示的真相会威胁到他们的信仰,而反对心理
学家在这些领域进行研究。斯金纳学派的心理学
家就总是面对这类相互矛盾的指责。例如,有批
评者认为行为主义的强化法则不适用于人类行
为。同时,另一些批评者则担心人们会运用这些
规律去对人类进行严酷的、不人道的控制。因
此,行为主义者腹背受敌,一些批评者否认行为
主义者所发现的行为定律有用,而另一些批评者
则害怕这些定律被滥用!
上述现象的产生主要是由于年轻的心理科学
刚刚开始揭示行为方面的一些事实,而在过去,这些问题总是游离于研究之外的。它的青涩多多
少少也解释了为什么许多人总是对这一学科产生误解。但无论如何,在过去的40年里,心理学已
经在我们称之为科学的这个相互关联的知识体系
中站稳了脚跟。认识不到这一点,就会对心理学
产生各种各样的误解。小结
心理学是一个主题非常广泛,但又相对松散
的学科,它包含一些通常不被归入同一概念的众
多研究主题。然而,它们都使用科学方法来理解
行为,从而实现了学科的统一。科学方法绝非是
指一套生硬的规则,而是指一些非常普遍的原
则。最重要的三点是:(1)科学采用系统的实
证主义的研究方法;(2)它以可公开验证的知
识为研究对象;(3)它研究实证可解的问题,并产生可检验的理论(第2章的主要内容)。构
成系统实证主义基础的结构化及可控制的观察是
本书随后几个章节的主题。科学通过同行评审等
程序和重复验证等机制来保证知识的公共性。
心理学是一门新兴的科学,因而经常会和世
俗智慧相冲突。这种冲突是任何新兴学科都会遇
到的,了解这种冲突有助于我们理解为什么有人
反对将心理学视为一门科学,并对心理学持敌意
态度。同时,与世俗常识之间的碰撞,也令心理学成为一门激动人心的学科。很多人进入这一领
域正是因为它提供了一个机会,让人们能够检验
那些被毫无争议地接受了数百年的“常识”。Chapter 2
可证伪性:如何挫败头脑中的小
精灵
1793年,一场严重的流行病——黄热病袭击
了费城。当时,这座城市里有一位顶尖的医生名
叫本杰明·拉什(Benjamin Rush),他是美国《独
立宣言》的签署人之一。在灾难过程中,拉什是
少数几位确实治疗了几千例黄热病的医生。拉什
信奉一种医学理论,认为黄热病必须用大量放血
的方法治疗(用手术刀或水蛭吸血的方法使血液
离开身体)。他为许多病人实施了这种疗法,当
他自己感染这种疾病的时候,他也如法炮制。评
论家指责他的治疗方法甚至比疾病本身更危险。
然而,随着疾病的流行,拉什对他的疗法却更加
自信了,即便曾有几个病人死去。这是为什么
呢?有人这么总结拉什的态度:“一方面坚信自
己的理论是正确的,另一方面又缺乏有效的方法
对治疗效果进行系统研究,因此他将每个好转的
病例都归为治疗方法的功效,而将每个死亡的病
例都归为病情的严重性。”(Eisenberg, 1977, p.
1106)换句话说,如果病人情况好转,就被作为
放血疗法有效的证据;如果病人死掉了,就被拉
什解释为病人已经病入膏肓,无药可救。我们现
在知道为什么对拉什的批评是正确的了:他的治
疗方法和黄热病本身一样危险。在本章中,我们
将要讨论拉什错在哪里。他的错误为阐明科学思
维中最重要的一项原则提供了样本,而这一原则
在评估心理学理论时尤其有用。
本章中,我们关注在第1章中已经讨论过的
科学的第三个基本特征:科学只研究可解的问
题。科学家们所说的“可解的问题”,通常是指可
检验的理论。科学家要确认某个理论是不是可检
验的,采取的方法就是确保该理论是可证伪的,也就是说,理论对应着自然世界中的真实事件。
接下来,我们就要看一看为何所谓的可证伪性标
准在心理学中如此重要。理论和可证伪性标准
本杰明·拉什在评估其疗法的效果时跌入了一
个致命的陷阱。他的评价方法根本就不可能让人
得出其治疗方法无效的结论。如果说,病人的恢
复是对他治疗方法有效性的肯定(对其医疗理论
的肯定),那只有当病人的死亡是对其治疗方法
的否定时才算公平。但事实上,他却把这种否定
合理化了。拉什解释证据的方式,违反了科学理
论建构和检验应遵循的最重要原则之一:他令自
己的理论不能被证伪。
科学理论的表述应该遵循这样的原则——从
中得出的预测有可能被表明是错误的。因此,对
某理论的新证据进行评价,必须使新的数据具有
证伪该理论的可能性。这项原则通常被称为“可
证伪性标准”。一位叫卡尔·波普尔(Karl
Popper)的哲学家一直致力于强调可证伪性标准
在科学进程中的重要作用,现在他的文章仍被从
事科研工作的科学家们广泛阅读。可证伪性标准主张,一项理论如果有用,它
所作出的预测必须是明确的,理论必须两面兼
顾,也可以说,这项理论在告诉我们哪些事情会
发生的同时,应该指出哪些事情不会发生。如果
不会发生的事情确实发生了,我们就得到了一个
明确的信号——这项理论有问题:它可能需要修
正,或者我们需要去寻找一个全新的理论。不管
哪种方式,我们将最终有一个更接近真理的理
论。相反,如果一项理论预测包括了所有可能观
察到的数据,那么它将永远不能被修正,同时我
们将被禁锢在当前的思维方式中,失去了取得进
步的可能。这就是说,一项成功的理论并不是可
以用来解释所有可能的结果,因为这样的理论本
身就丧失了任何预测能力。
在这本书的余下部分,我们会经常涉及理论
的评估,因此我们必须澄清一个关于理论的常见
误解。这个误解体现为我们常说的一句
话:“哦,这只不过是一种理论。”这句话代表了
外行人使用“理论”这个词时通常所指的意思:一
项未经证实的假设,一个纯粹的猜想或直觉。这
意味着一个理论与其他理论并无优劣之分。“理
论”这个词在科学上绝对不是这么用的。当科学
家说到“理论”的时候,他们指的不是未经验证的
猜想。科学上的理论是一组具有内在联系的概念,它们能对一组数据作出解释,并对未来实验的结
果作出预测。假设是从理论中产生的具体预测
(理论则更加普遍和全面)。目前可行的理论是
那些产生了一些假设,并且其中许多已经得到了
验证的理论。因此这种理论的理论结构与大量的
实证观察相一致。然而,当观察数据开始与理论
中提出的假说相矛盾的时候,科学家们会尝试构
建一个能为数据提供更好解释的新理论(或者在
更通常的情况下,只是修正已有的理论)。因
此,目前在科学范畴内所讨论的,都是在一定程
度上已经被证实了的、所作出的预测并没有与现
有的数据相矛盾的理论。它们并非纯粹的猜想和
直觉。
外行人和科学家们使用“理论”这个词时的这
种差异,经常会被一些试图将神创论纳入公立学
校教育的虔诚的正统基督教徒所利用(Miller,2008; Scott, 2005)。他们的论点通常是“进化论
毕竟只是理论”。这种观点试图借用外行人对“理
论”术语的用法,蓄意将理论歪曲为“只是一个猜
想”。然而,通过自然选择的进化理论不是外行
人所理解的“理论”(相反,在外行人的理解中,它应被称之为“事实”,见Randall, 2005),而是
一个科学意义上的理论,是由一系列庞大而多样
的数据支持的结论(Dawkins, 2010; Shermer,2006; Wilson, 2007)。它并不等同于其他任何猜
想,不是一个纯粹的猜测。相反,它与从属于其
他学科的知识密切相关,这些学科包括地质学、物理学、化学以及生物学的各个分支。著名的生
物学家西欧都萨斯·杜赞斯基(Theodosius
Dobzhansky, 1973)在他的一篇题为《生物学中除
了进化论以外,别无他物》(Nothing in Biology
Makes Sense Except in the Light of Evolution)的著
名文章里就阐述了这一观点。
敲门节奏理论
下面假设的例子展示了可证伪性标准是如何
起作用的。一个学生在敲我的门。跟我同一办公
室的同事有一套“不同的人以不同的节奏敲门”的
理论。在我开门之前,我的同事预言门后是一位
女性。我打开门,这个学生确实是女性。事后我
告诉同事,他的表现令我惊叹,但这种惊叹程度
非常有限,因为即使没有他所谓的“敲门节奏理
论”,他也有50%的正确几率——实际上这一概率
要更高一些,因为在大多数校园里,女性都比男
性多。他说他的预测能高于随机水平。另一个人
来敲门,我的同事预测说,这是个男性,而且不
到22岁。我打开门,果然是个男生,而且我知道他刚从中学毕业。我承认我有点被震撼了,因为
我所在的大学有相当数量的学生是大于22岁的。
当然,我仍然坚持说,校园里年轻的男性相当普
遍。见我如此难以被说服,我的同事提出做最后
一次测试。在下一个人敲门之后,我的同事预
测:女性,30岁,5英尺[1]
2英寸[2]
高,左手拿书
和挎包,用右手敲的门。打开门后,事实完全证
明了预测,对此我的反应截然不同了。我不得不
说,如果我的同事不是使用诡计事先安排这些人
出现在我门口的话,我现在的确非常震惊。
为什么我的反应会不同呢?为什么我同事的
三次预言会让我产生三种不同的从“那又怎么
样”到“太不可思议了”的反应?答案与预测的具体
性和精确性有关。越精确的预测在被证实的时候
会给我们越大的触动。要注意,不管怎样,精确
性的变化和可证伪性直接关联。预测越具体和精
确,有可能证伪它的观测现象就越多。例如,有
很多不是30岁和5英尺2英寸高的女性。请注意这
里暗含的信息:从我截然不同的反应可以看出,一个能够最大限度地将不可能发生的事件预测出
来的理论最容易令我折服。
好的理论作出的预测总是会显示自己是可证
伪的。坏的理论不会以这种方式把自己置于危险
的境地,它们作出的预测是如此笼统,以至于总会被证明是正确的(例如,下一个来敲我门的人
会是100岁以下),或者,这些预测会采用一种
能免于被证伪的措辞方式(如本杰明·拉什的例
子)。事实上,当一种理论被置于“不可被证
伪”的保护下,那么可以说它已经不再是科学
了。事实上,哲学家卡尔·波普尔正是由于试图界
定科学和非科学的区分标准,才会如此强调证伪
原则的重要性。这里的讨论和第1章中我们有关
弗洛伊德的讨论,甚至与心理学之间都有直接的
联系。
弗洛伊德与可证伪性
在20世纪最初的几十年,波普尔一直在探
寻,为何一些科学理论似乎导致知识的进步,而
其他一些则导致智力停滞(Hacohen, 2000)。例
如,爱因斯坦的广义相对论引发了一系列惊人的
发现(例如,从一个遥远的恒星发出的光线经过
太阳附近时发生弯曲),恰恰是因为它是这样建
构预测的:许多事件或现象一旦被证实与之相矛
盾,就可以证伪该理论。
波普尔指出,一些使知识停滞的理论却并非
如此,并以弗洛伊德的精神分析法作为例子。弗洛伊德的理论使用一个复杂的概念结构,在事后
解释人类行为,但并不作事前的预测。简而言
之,弗洛伊德的理论可以解释一切,但是波普尔
认为,也正是这个属性使得它在科学上毫无用
处。它不作具体的预测。精神分析理论的拥护者
花费大量的时间和精力试图用他们的理论解释人
类所有已知的活动——从个人的怪癖行为到广泛
的社会现象,但他们在使这个理论成功地成为事
后解释的丰厚资源时,也剥夺了其所有的科学实
用性。如今,弗洛伊德的精神分析理论在激发文
学想象力方面的作用比在当代心理学中扮演的角
色更重要。它在心理学中的地位日益下滑,部分
原因就是未能满足可证伪性标准(Wade Tavris,2008)。
这种不可证伪理论的存在会导致实际的危
害。例如,对于孤独症(部分基因紊乱所致的疾
病)成因的解释就曾被精神分析的解释带入了死
胡同。受到精神分析学派的影响,心理学家布鲁
诺·贝特海姆(Bruno Bettelheim)让“冰柜母亲”这
个如今已被证伪的概念在当时广为流传,认
为“造成婴儿时期孤独症的原因是父母不希望孩
子存在”(Offit, 2008, p.3)。像这样的观念不仅
有破坏作用,还阻碍了孤独症的研究。
作为另一个例子,回想一下抽动性秽语症的历史。这是一种以身体抽搐和痉挛为特征的紊
乱,并伴有言语症状,如嘟囔、吠叫、模仿言语
(无意识地重复他人的话)和秽语(强迫性重复
淫秽词语)。抽动性秽语症是一种器质性的中枢
神经系统紊乱,并已经成功地被药物治疗所攻克
(Scahill et al., 2006; Simth, Polloway, Patton,
Dowdy, 2008)。纵观历史,抽动性秽语症患者一
直遭受着迫害,早期被宗教统治者视为妖魔,近
代又被认为是鬼怪附体,要被强制驱魔(Hines,2003)。更重要的是,在1921至1955年之间,对
这种病的解释及疗法一直被精神分析学派的概念
体系所把持,这在很大程度上阻碍了人们对此病
成因及治疗的理解(见Kushner, 1999)。有关这
种病症的不可证伪的精神分析解释层出不穷。这
些似是而非的解释所造就的概念泥潭蒙蔽了这一
病症的实质,也阻碍了对其进一步的科学探究。
例如,有一位作者曾经这样写道:
(抽动性秽语症是)精神分析导致脑部
疾病研究发生倒退的典型例子。勒·图雷特
(La Tourette)将疾病归因于大脑的退行
性变化过程。而在20世纪最初的几十年,由
于弗洛伊德理论的盛行,对这种病的关注偏
离了大脑……这一倒退的结果使病人往往被
转到精神科医生(通常是精神分析学派的医
生)而非神经科医生那里,因此没有接受生理检查和研究(Thornton, 1986, p.
210)。
夏皮罗等人(Shapiro, Bruun, Sweet,1978)提到,一位精神分析师认为,他的病
人“不愿意放弃抽动,因为这成了她性快感的源
泉和潜意识性欲的表达”;另一位精神分析师则
认为抽搐“等同于手淫……与生殖器快感相联系
的力大多转移到了身体的其他部位”;第三位认
为抽搐是一种“肛门施虐的迁移症状”;第四位认
为,抽动性秽语症的患者具有“强迫型人格以及
自恋倾向”,病人的抽动“代表了一种情感症状,对想表达情感的压抑性防御”。
事实上,这类例子不胜枚举,在他们无知自
大的过度自信中尤为典型。发展心理学家杰罗姆·
卡根(Jerome Kagan, 2006)告诉我们:“弗洛伊
德的弟子桑德尔·费伦齐(Sandor Ferenczi),其
本人从未见过抽动性秽语症病人,但是却犯下了
同样严重的错误,他曾写过,抽动性秽语症病人
的频率性的面部抽搐是由于对手淫的压
抑。”(p.179)
夏皮罗等人(1978)对这类理论现状的总
结,很好地说明了忽视可证伪性标准的有害影
响:精神分析这种理论化的方式简直面面俱
到。抽搐是迁移性的症状而非歇斯底里症、肛门的而又是性欲的、受意志控制的而又是
强迫性的、器质性病变同时又与原始心理动
力有关……这些心理标签、诊断和治疗被不
幸而且是以一种毫不谦卑、相当武断、伤害
巨大的方式强加在病人及其家属身上。因为
其随后的广泛影响,这些观点为对此病症的
认识和诊治造成了极大的障碍(pp. 39-42,50, 63)。
当研究人员承认精神分析的“解释”对治疗该
疾病毫无用处的时候,对抽动性秽语症的认识和
治疗才开始获得进展。那些毫无用处的解释是诱
人的,因为它们似乎能对事情进行解释。事实
上,它们都是在事后对所有事情作出解释的。然
而,它们提供的解释不过是制造了理解的幻觉。
由于总试图在事后解释一切,它们也就堵死了前
进的大门。只有当一种理论并不预测所有事情,而是提出具体的预测——提前告诉我们哪个特定
的情形会出现时,该理论才会出现进步。当然,从这样的理论推导出的预测可能是错误的,但这
是优势,而非缺点。
小精灵如果人们能够从所研究的问题里跳出来,尤
其是人们若能以史为鉴(如本杰明·拉什的例子)
的话,就不难识别出那些不能证伪的概念体系。
当其例证明显是编造的时候,也很容易察觉其不
可证伪性。举例来说,大家还不知道,我已经发
现有一种大脑机制在控制行为,你很快就会在随
处可见的八卦杂志上看到这个发现。我发现在大
脑左半球的语言区附近住着两个小精灵,它们有
能力控制大脑许多区域中的电化学过程。而且,长话短说,它们基本上控制了一切事情。但是,有一个问题阻止我们看到它们,那就是小精灵有
能力发现任何对大脑的侵入(外科手术、X光
等),一旦觉察到外界的探测,它们就会消失
(我忘记说了,它们具备隐身能力)。
毫无疑问,我在这里是用一个更适合小学生
的例子来侮辱你的智慧。很明显,这个例子是我
捏造的,但我对小精灵的假设永远无法被证实是
错误的。不妨考虑一下。作为心理学导论的讲师
和公开演讲者,我经常被问到,为什么不讲授在
过去几年里在超感官知觉(extrasensong
perception, ESP)和通灵学方面取得的那些惊人
的新发现。我不得不告诉这些提问者,他们所获
悉的大多数相关信息,无疑都是来自于大众媒体,而非科学界所承认的信息来源。事实上,一
些科学家曾关注过这类说法,但没能够重复这些
发现。我要提醒各位读者,要将一个研究成果认
定为确定的科学事实,可重复性是至关重要的,尤其是当研究结果与以前的数据或现有的理论相
矛盾的时候。
我甚至可以坦率地说,许多科学家对ESP研
究已经失去了耐心。原因当然与此领域充斥着欺
诈、江湖骗术和媒体炒作的现象有关,但令科学
界觉醒的更重要的原因是马丁·加德纳(Martin
Gardner, 1972)所谓的“ESP研究的22条军规”。其
运作方式如下:一名“信奉者”(在开始调查之前
就相信ESP现象存在的人)声称已在实验室证明
了ESP。一名“怀疑者”(质疑ESP存在的人)被邀
请证实这种现象。通常,在观察实验情境之后,怀疑者会要求信奉者进行更多的控制(我们会在
第6章中讨论这种类型的控制),虽然这些要求
有时候会被拒绝,但通常善意的信奉者们会同意
他们的要求。当加入了实验控制之后,这种现象
就不再出现了(Farha, 2007; Kelly, 2005; Milton
Wiseman, 1999; Park, 2008;Wiseman, 2011)。怀疑
者会对这种失败作出正确的解释——早先对这个
现象的证实是由于缺乏足够的实验控制,因此结
论不能被接受。但他们往往吃惊地发现,信奉者
并不承认早先的证明是无效的。相反,他们搬出超感知的“22条军规”:他们坚称,心理能量是很
敏感的、微妙的,并极易受到影响。怀疑者
的“负面感应”是瓦解这一“超感官能量”的罪魁祸
首。信奉者认为,怀疑者的“负面气场”被移开
后,这种心理能量无疑将会回归。
这种对无法在实验室中证实ESP的解释方
式,在逻辑上与我编造的小精灵的故事相似。
ESP的运作就像小精灵一样。只要你不侵入性地
仔细观察它,它就在那儿。如果你观察它了,它
就不见了。如果我们接受这种解释,那么向怀疑
者证明这一现象就变得不再可能。这种现象只为
信奉者现身。当然,这种说法在科学领域是不能
接受的。我们没有磁力物理学家和非磁力物理学
家之分(即磁场只对前者存在)。以这种方式解
释ESP的实验,使得ESP的假设变得像小精灵的
假设一样不可证伪。正是这种解释方式,将ESP
排除在了科学殿堂之外。
不是所有的证实都等价
可证伪性原则对于我们如何看待一个理论的
证实过程具有重要的意义。许多人认为,一个好
的科学理论就是被多次证实的理论。他们假设,被实的次数是对理论进行评价的关键。但是,可
证伪性原则意指理论被证实的次数并不是最重要
的因素。原因在于,正如“敲门节奏理论”所展示
的那样,并不是所有的证实都是等价的。证实能
否令人信服,取决于预测在何种程度上将自己暴
露在可能被证伪的情境下。一个非常具体的、可
能被证伪的预测(例如,一位女士,30岁,5英
尺2英寸高,左手拿书和挎包,用右手敲门),比20个不可证伪的预测(例如,一个小于100岁
的人)拥有更强的说服力。
因此,我们不能仅关注理论被证实的数量,更要关注验证本身的质量。将可证伪性作为一种
评价标准,就可以使那些使用研究结果的人抵制
不科学的、全能理论的诱惑。这种全能理论会不
可避免地妨碍我们对世界和人类本质进行更深入
的探索。事实上,这种理论的死角也正是最魅惑
人的地方,因为它们永远不能被证伪。在纷繁多
变的现代世界中,这种理论千年不变。
波普尔经常指出:“这些(不可证伪的)理
论拥有巨大的心理吸引力,其秘密在于它们能够
解释一切事情。预先知道无论什么事情发生,你
都能理解它,不仅给你智力上的掌控感,而且,更重要的是,让你拥有应对这个世界所需的安全
感。”(Magee, 1985, p. 43)但是,这种安全感的获得并不是科学的目标,因为对这种安全感的追
求是以知识发展的停滞为代价的。科学是一套不
断挑战原有信念的机制,在这种机制里,原有信
念以一种能够被证伪的方式接受实证检验。这一
特点往往使科学(尤其是心理学)与所谓的世俗
智慧或者常识直接发生冲突(正如我们在第1章
中所讨论的)。
可证伪性和世俗智慧
心理学威胁到世俗智慧所提供的安逸感,因
为作为一门科学,它不能只提供无法被反驳的解
释。心理学的目标是对各种行为理论逐一进行实
证检验和筛选。某些世俗智慧表述得很清晰,经
得起实证检验,这当然是心理学所欢迎的,而且
其中许多已经被纳入了心理学理论。然而,心理
学并不追求那类事后能解释一切,但事先无法作
出任何预测的理论,不追求这种解释系统所带来
的安逸感。它不接受那些被设计得永不可变、并
代代相传的世俗智慧体系。试图向学生和公众隐
瞒这一点无疑是自毁长城。不幸的是,一些心理
学指导教师和普及者觉察到了心理学对世俗智慧
的威胁给一些人造成的困扰,于是他们有时会试
图通过传递错误信息来安抚这种情绪,如“你会学到一些有趣的东西,但别担心,心理学不会挑
战那些你深信不疑的观点”。这是一个错误,并
且会对“什么是科学”和“什么是心理学”造成混
乱。心理学建构了有关于性行为、智力、犯罪、经济行为及其他诸多人们感受强烈的主题。如果
对上述这些主题的调查没有发现一些令某些人感
到颠覆的事情,这才奇怪呢!
科学寻求概念上的变化。科学家试图描绘世
界的真实图景,而此图景可能与我们的固有信念
正好相反。现代思潮中有一种危险的趋向——认
为应避免让一般大众知道世界的真正本质,一种
无知的面纱是必要的,以防公众面对真相时手足
无措。心理学与其他科学一样,拒绝向人类隐瞒
真相。
此外,当我们被那些对人类行为有误解的人
们所包围的时候,大家都会蒙受损失。公众对于
教育、犯罪、健康、生产力、儿童福利和许多其
他重要问题的态度塑造了我们的世界。如果这些
态度源于错误的行为理论,那么我们大家都会受
到伤害。
承认错误的自由科学家们发现,可证伪性原则的一个最具解
放意义和最有用的启示是:在科学上,犯错并不
是罪过。哲学家丹尼尔·丹尼特(Daniel Dennett,1995)曾说过,科学的本质就是“在公众面前犯
错——在众目睽睽下犯错,以期他人能够帮助其
修正这些错误”(p. 380)。当数据与理论不符
时,通过对理论进行不断地修正,科学家们最终
共同构建起能更好地反映世界本质的理论。
事实上,如果我们能够在日常生活中使用可
证伪性原则的话,我们的生活品质将会大大改
善。这就是为什么我在本节的第一句话中使
用“具有解放意义”这个词的原因。它包含着一种
个人化的期许,即此处产生的理念能够同时对科
学之外的领域有所启示。如果我们能够理解这一
切,当我们的信仰与观察到的事实相冲突时,我
们最好是调整信仰,而不是否认事实和坚持错误
的想法,这样我们将会很少遇到一些个人和社会
问题。
当你与某人激烈地争论的时候——也许就是
当你给出一个有力的反击来捍卫你的观点的时候
——有多少次你会突然意识到你搞错了某个关键
事实或论据?这时你会怎么做?你会收回前面的
话,并向别人承认错误,同时承认别人的解释现
在看起来比你的更合理吗?或许不会。如果你和我们中的大多数人一样,那么你一定会采用“无
限合理化”的策略,即没完没了地寻找一些理由
为自己先前的错误辩解。你试图在不承认失败的
情况下使自己从争论中全身而退。你最不可能做
的就是承认自己错了。这样的话,你和争论对手
都会更加疑惑:到底哪一种信念更接近真理?如
果争论不能成为公共性的(如在科学中那样),如果正确和错误的信念以同样激烈的方式争辩,如果争论的结果不能得到正确的反馈(如本
例),那就没有更可靠的机制使信念与现实相吻
合了。这就是为什么那么多私人和公开的对话令
人困惑,为什么相比所谓的常识或世俗智慧,心
理科学在解释人类行为的原因方面更加可靠。
如果理解了我们的信念在历史上多么地因事
而异,可能就会发现我们在证据面前是多么容易
改变自己的信念。也就是说,信念的改变与否仅
仅取决于他们成长时在某地某时发生的事件的多
少。然而调查显示,大多数人对这种情况不够重
视。在我自己的实验室中,我们对设计来评定人
们鉴别信念的历史可变性的能力问卷中的数据进
行分析。以问卷中的一个项目为例,被试必须对
于“即使我周围环境(家庭、邻居、学校)与现
实情况不同,我也会有与现在相同的宗教思
想”这一陈述表达“非常、中等地或些许地同意或
者不同意”。宗教问题是信念随环境变化的典型案例(欧洲、美国人信奉基督教;非洲和中东人
信奉伊斯兰教;印度信奉印度教等)。虽然如
此,我和我的同事在几个调查中发现,大约40%
到55%的大学生会认为他们的宗教思想无论如何
也不会随着他们的历史环境(父母、国家、教
育)而改变。
证伪态度有益于科学本身的原因是,科学通
过排除不正确的假设而非集中精力研究完美的理
论而进步,这种态度在研究一个问题的初期尤为
重要。事实上,生活中诸多领域的情况都是如
此。通常定位最正确的表现方式是很困难的,但
是聚焦表现的错误却相对容易。评论家尼尔·波兹
曼(Neil Postman, 1988)指出,医生很难去定
义“完全健康”,但却很擅长发现疾病。同样,律
师能够轻易判断不公正,却很难定义“完全公
正”。证伪态度对于科学家来说很有用也正是基
于这一原因。尤其在研究问题的早期,研究的焦
点在什么是错误的——排除不正确的信念——对
科学家来说是很有成效的方法。
在科学过程中犯错是正常的,对于科学进步
来说,最大的危险在于我们人类极力避免将自己
的固有信念暴露在可能被证明是错误的环境中的
倾向,许多科学家已经意识到了这一观点的重要
性。科学家们必须避免这种倾向,诺贝尔奖得主彼得·米德瓦(Peter Medawar, 1979)认为科学家
应当牢记:一个假设在何种程度上被确信为正
确,实际上与其是否为真无关(p. 39; 原文为意
大利语)。
可以通过这样一种途径来理解米德瓦的话。
喜剧演员斯蒂芬·科尔伯特(Stephen Colbert)在
其2005年12月17号的表演中,创造了术语“感实
性”。感实性是指“内心感到真实,但是没有证据
支持”(Manjoo, 2008, p.189)。米德瓦说的意思
是,科学拒绝感实性。这常常使科学在现代社会
中成为异类,因为现代社会中,感实性比以往更
为普遍。
心理学界许多最具声望的科学家都遵循米德
瓦的建议——“一个假设在何种程度上被确信为
正确,实际上与其是否为真无关。”在一篇报道
实验心理学家罗伯特·克诺德(Robert Crowder)
职业生涯的文章中,引述了他的一位同事马扎林·
巴纳吉(Mahzarin Banaji)的话:“他是我认识的
最不维护自己理论的科学家。如果你发现一种方
法证明他的理论有漏洞,或者他的实验发现有局
限性或有缺陷,他会非常高兴,并会和你一起计
划如何推翻该理论。”(Azar, 1999, p. 18)艾泽
(Azar, 1999)描述了克诺德如何提出了一个叫
作“前分类听觉存储器”的记忆成分理论,然后又仔细地设计了一个实验研究证伪了自己的模型。
物理学家杰罗米·格鲁普曼(Jerome Groopman,2009)描述了证伪态度在医疗诊断中是多么实用
和有效:“所以医生学会去质疑他提取的病历数
据的有效性……最有启发性的时刻是你被证实是
错误的,并且意识到你相信自己知道的比实际的
多,其实是忽略了能够否认你的推诊或是未能考
虑到病人患有不止一种疾病的关键信
息。”(p.26)
早于达尔文数百年前,亚里士多德曾经说
过:“受过教育的标志是可以去思考一种思想,而不去接受它。”更有意思的是,经济学家约翰·
梅纳德·凯恩斯在经济大萧条期间阐明了证伪态
度,他批判亚里士多德道:“事实改变,我就会
改变我的观念。你能吗,先生?”(Malabre,1994, p.220)
但是,要让科学发挥作用,并不需要每位从
事科学工作的科学家都具备证伪的态度。科学那
种揭示世界真知的独特力量,并不产生于科学家
们独特的德行(即他们是完全客观的,他们在解
释研究结果时从来不带偏见等)。实际上,这种
力量的产生是因为会犯错的科学家们身处一个证
实与平衡的程序中。在这个程序中,总会有其他
科学家提出批评并发现他们同行的错误。哲学家丹尼尔·丹尼特提出过相同的论点:“不是每位科
学家都必须表现出罗伯特·克诺德的客观性。”丹
尼特强调“科学家和其他任何人一样容易犯错,但认识到他们及其所属团体的犯错根源之后,他
们设计出精巧的系统来约束自己,努力防止自身
弱点和偏见影响自己的研究结果。”(p. 42)心
理学家雷·尼克尔森(Ray Nickerson, 1998)以一
种更为幽默的方式道出了相同的观点:“科学家
们的虚荣心实际上在科学进程中起着作用,“科
学家对自己的想法抱有的批判性态度并没有在很
大程度上导致科学的成功……更真实的情况是,每个科学家都积极地想要证明某些科学家所持有
的观点是错误的。”(p. 42)科学知识的力量并
不是来自于科学家的德行,而是源于他们不断交
叉检验彼此的知识和结论的这一社会过程。
想法不值钱
先前关于检验世俗智慧的讨论,将我们引向
了可证伪性原则的另一个有趣推论:想法不值
钱。说得更准确些,我们的意思是某些类别的想
法不值钱。生物学家和科学作家史蒂芬·古尔德
(Stephen J. Gould, 1987)对此有所阐述:15年的月刊专栏写作生涯,让我收到各
个科学领域非专业读者的海量来信……我发
现一个常见的、同时是压倒性的错误观点。
人们会告诉我他们提出了一项革命性的理
论,它会拓展科学的边界。这些理论通常以
单倍行距打印在几张纸上,内容通常是对最
深层的终极问题的猜测——什么是生命的本
质?宇宙的起源?时间的起点?但是,这些
想法不值钱。任何智力正常的人都能在早饭
前想出几个这样的念头。科学家们自己也很
容易就能想出来。但我们不这样做(或者
说,我们只让它们留在自己脑子里),因为
我们不能找到方法来验证它们以决定它们的
对错。一个既不能被证实也不能被证伪的可
爱想法,对科学来说又有什么用呢?
古尔德对最后一个问题的回答是:“没
用。”古尔德这里所说的廉价想法正是我们早先
在对卡尔·波普尔观点的讨论中提到的那些:包罗
万象、复杂、“模糊”、能够用来解释一切的宏大
理论——这种理论的建构更多是为了提供情感支
持,因为它们没打算被改变或抛弃。古尔德告诉
我们,这种理论对于科学目标是无用的,无论它
们多么有抚慰功能。科学是创造性的过程,但是
这种创造性需要让概念结构符合实验数据。这并
不容易做到。那些如实解释真实世界的想法一点儿也不廉价。也许这就是为什么好的科学理论很
难提出、而不可证伪的伪科学信仰体系泛滥的原
因,因为后者很容易建构。
科学理论与世界紧密联系。它们是可证伪
的,并能作出明确具体的预测。事实上,形成真
实的、科学真正可以解释的理论是一项困难的任
务。但是,理解科学运作的一般逻辑并没有那么
困难。事实上,现在已经出版了大量专为儿童撰
写的关于科学思维逻辑的书籍(Binga, 2009;
Bower, 2009; Dawkings, 2012; Epstein, 2008;
Swanson, 2001, 2004)。
注释
[1]1英尺≈0.305米。——译者注
[2]1英寸=2.54厘米。——译者注科学中的错误:逼近真理
在解释可证伪性原则的过程中,我们已经勾
勒出科学进步的简单模式:提出理论、从中推导
出假设,然后让假设接受各种技术或方法的检验
——我们将在本书余下的部分讨论这些技术。如
果假设通过了某些实验的检验,该理论就得到了
某种程度的确证;如果假设被实验证伪,这个理
论就得做出某种程度的改变,或者被一个新理论
所取代。
当然,虽然科学上的知识是暂时性的,由理
论得出的假设可能是错误的,但这并不是说所有
的一切都要被拿来检验一番。科学中有很多理论
已经被确认过无数次,它们被称为“公理”,因为
它们几乎不可能被未来的实验推翻。我们不大可
能在某一天发现,血液不是循环的,或者地球并
没有在环日轨道上。这些众所周知的事实并不是
我们一直在讨论的假说。它们也不是科学家们的
兴趣关注点,因为它们已经是确定无疑的。科学家只对已有知识范围之外的问题感兴趣。对于确
定无疑的事实,他们毫无兴趣。
科学实践的这一面——科学家侧重于已知事
实的前沿,而忽视那些已经被充分证实的问题
(所谓的公理)——对大众来说很难理解。科学
家们似乎总是更强调未知的事物而非已知事物。
这千真万确,而且科学家有很好的理由这么做。
为了推进知识的进步,科学家们必须一直身处已
知的前沿。当然,这里是很多事情都不确定的地
方。但科学进步正是通过这个过程来实现的,即
试图在已知的前沿减少不确定性。这种特点常常
使得科学家被公众视为“没谱的”。但这只是表面
现象,科学家们只是对知识的前沿不确定——这
使我们对于事物的理解不断加深。科学家们不怀
疑那些被很多研究重复证实的事实。
同样需要强调的是,当科学家通过观察法证
伪一个理论或用一个新理论代替旧理论的时候,并不意味着他们要将先前用以建立旧理论的事实
全都扔到一边(我们会在第8章展开讨论这个话
题)。相反,新理论应该能够解释所有旧理论能
解释的事实,还能够解释旧理论不能解释的事
实。理论被证伪并不意味着科学家非得建构一个
全新的理论。复杂的理论通常是大体正确而非完
全正确的,大体正确的判断可能更接近事实的真相(Radcliffe Richard, 2000)。
科普作家伊萨克·阿西莫夫(Isaac Asimov)
在一篇题为《错误的相对性》(The Relativity of
Wrong, 1989)的文章中很好地说明了理论修正的
过程,文中谈到我们对地球形状的理解是如何完
善的。他首先提醒我们,不要以为“地球是平
的”这一古老信念是愚蠢的,在平原上(大部分
有文字的人类文明都发源于平原),地球看上去
相当平坦。阿西莫夫要求我们试着对不同的理论
进行定量的比较,看结果会告诉我们什么。首
先,我们能够将不同理论表述为它们预测地球表
面每公里曲率的大小。“地平理论”会说每公里的
曲率为0。现在我们都知道,这种理论是错误
的。但从某种意义上说,它又很接近真理。正如
阿西莫夫(1989)所说:
亚里士多德之后的一个世纪,古希腊的
另一位哲学家埃拉托塞尼斯
(Eratosthenes)指出,太阳在不同纬度上
投射不同长度的影子(如果地球是平面的,所有的影子都应该一样长)。根据影子长度
的不同,他计算出地球的周长为2.5万英
里,那么这个球体曲率是0.000126度英
里。正如你所见,这个数值非常接近0……
这从0到0.000126的差别解释了为何我们用了如此长的时间,才放弃“地球是平的”这
一观念,并转而相信地球是球状的。提醒你
一下,即使是像0~ 0.000126之间这样细小
的差别也是至关重要的。失之毫厘,谬以千
里。如果这点小差别没有被考虑到,如果地
球被认为是一个平面,而不是一个球,那么
我们将无法精确地绘制地球上大面积区域的
地图(pp. 39-40)。
当然,科学并没有止步于“地球是球体”这一
理论。我们早先讨论过,科学家们一直在尝试尽
量改进他们的理论,并挑战当前知识的局限。例
如,牛顿的引力理论预言地球并不是完美的球
形,这个预言确实被证实了。现在已经证明,地
球在赤道附近略微凸起,而在两极附近略微扁
平。这是个被叫做“扁球体”的形状。地球从北极
到南极的直径是7900英里,赤道直径是7927英
里。所以,地球的曲率并不是一个常数(像一个
理想的圆球那样),而是在每英里上有约7.973英
寸到8.027英寸的微小变化。正如阿西莫夫
(1989)所言:“从球体到扁球体的修正比从平
面到圆的修正要小得多。因此,虽然‘地球是球状
的’这一理解有误,但严格地说,它没有错到‘地
球是平的’那种程度。”(p.41)
阿西莫夫关于地球形状的例子为我们展示了科学家们使用“错误”、“误差”和“证伪”这些术语
的不同情境。这些术语并不是说被检验的理论错
得一无是处,这些理论仅仅是不完善的。所以,当科学家强调说理论是暂时性的、可能被未来的
研究发现所修正的时候,他们所指的就是例子当
中的情形。当科学家相信地球是球状的时候,他
们认识到在未来某一天,这个理论需要在细节上
进行修正。无论如何,从球体到扁球体的变化维
持了地球是一个球体的“大体正确性”。我们绝不
会在某天醒来突然发现它其实是一个立方体。临
床心理学家斯科特·利连恩费德(Scott Lilienfeld,2005)向心理学专业的学生这样介绍阿西莫夫的
观点:
当向学生解释心理学知识本来就是暂时
性的、可以被修正的时候,有些学生会错误
地得出结论,认为真正的知识是不存在的。
这种观点在某些后现代主义圈子里非常流
行,它忽视了对不同确定程度的知识的区
分。虽然绝对的肯定在科学中无法实现,但
一些科学理论,如达尔文的自然选择学说,已经被极好地证实了,而其他一些理论,如
支持占星术的理论,已经遭到了有力的驳
斥。还有一些理论,如认知失调理论,仍处
在科学争议当中。因此,科学理论是个确定
程度不同的连续体:有些已经成为了确定的事实,另外一些则被完全地证伪了。对于科
学问题,方法论上的怀疑主义并不产生完全
确定的答案(原则上说,这些答案可能会被
新的证据推翻),这个事实并不意味着知识
是不存在的,只是说知识是暂时性的。
(p.49)
“科学必须产生确定的知识”这一错误信条常
常被用来攻击科学。古生物学者尼尔·舒宾(Neil
Shubin)描述了神创论者如何利用这一策略。在
和科学作家纳塔利·安吉尔(Natalie Angier,2007)的访谈中,舒宾说:“神创论们首先试图
将科学描绘成铁板一块的事实,然后攻击那些‘确
定’中不是特别确定的事情。他们叫嚷着‘哈!你
自己都理不清思路了吧,你太不不靠谱了。那我
们为什么要相信你所说的一切呢?’其实是他们首
先竖起了一个‘科学毫无瑕疵’的稻草人当靶
子。”(p.20)小结
科学家们提到“可解的问题”时,通常指的
是“可检验的理论”。“可检验的理论”的定义在科
学上是非常明确的:这个理论是有可能被证伪
的。如果一个理论不可证伪,并且和自然界的真
实事件没有关联,那么它就是无用的。心理学里
一直充斥着不可证伪的理论,这也正是心理学发
展缓慢的原因之一。
好的理论能够作出具体的预测,具有高度的
可证伪性。相比于一个不精确的预测,如果一个
明确具体的预测得到证实,就会为产生这个预测
的理论提供更大的支持。简言之,可证伪性原则
的一个含义就是,并非所有理论的验证都具有同
样的价值。可证伪性越高,预测越具体,得到证
实的理论就越受青睐。即使预测并没有得到证实
(比如它们被证伪了),可证伪性对于理论的发
展也是有用的。一个被证伪的预测说明,原有理
论要么应当抛弃,要么需要进行改变,以解释不一致的数据。正是通过这种由被证伪的预测所引
发的理论修正,像心理学这样的科学才能逐步向
真理逼近。Chapter 3
操作主义和本质主义:“但是,博士,这到底是什么意思?”
物理学家真正理解地心引力是什么吗?我的
意思是“真正”。他们知道“地心引力”这个术语的
真正含义是什么?它的内在本质是什么?说到地
心引力时,最终所要表达的意思是什么?说到
底,它究竟是什么?类似这样的问题反映了一种
科学观点,哲学家波普尔称其为“本质主义”。这
种观点认为,从内在本质或者本质属性的角度对
现象作出最终解释,才算得上是好的科学理论。
支持这种观点的人通常也相信,无法对现象作出
最终解释的任何理论都是无用的,这样的理论不
能反映真实的内在情况,不能反映世界存在方式
的本质。本章,我们将讨论为什么科学不去回答
本质主义者的问题,而是通过对概念进行操作性定义得以进步。为什么科学家不是本质主义者
事实上,科学家并不企图获得本质主义者所
追求的那类知识。从这一意义上讲,对于本章一
开始提出的问题的正确回答是:科学家不知道地
心引力是什么。科学并不试图回答关于宇宙
的“终极”问题,彼·得米德瓦(1984)曾写道:
确实存在那些科学不能回答并且在科学
发展的可预见的范围之内也不可能得到答案
的问题。比如,那些孩子们会提出的问题
——“终极问题”……我能想到的这样的问
题有:世界是如何开始的?我们来到这世间
是为了什么?生活的意义是什么?(p.
66)
然而,即使科学不能回答终极问题,也
不意味着必须接受其他的答案;也不能理所
当然地认为,既然这类终极问题能被提出,就一定能够被回答。就我们目前的理解力而
言,这类问题是无从回答的。(p. 60)但是,最终就其能回答的那类问题而
言,科学的潜力是无穷的……没有什么可以
阻挡或终止科学的发展,除了诸如缺乏勇气
之类的道德方面的缺陷。(p. 86)
科学家之所以质疑那些自称为终极问题给出
绝对答案的人、理论或者观念体系,一个原因就
是科学家认为终极问题是无法回答的。科学家并
不会宣称他们可以提供完美的知识;科学的独特
优势并不在于它是一个不会犯错的过程,而在于
它提供了一种消除错误的方式,它能不断消除我
们认识中的错误。再者说,自称完美或绝对知识
的主张及做法,却往往会阻碍人们的探索。自由
而开放地探索知识是科学活动的一个先决条件。
科学家们总是在怀疑那些号称已经找到问题最终
答案的言论。
本质主义者喜欢咬文嚼字
本质主义者的态度通常有一种表现:在探求
知识之前,过于关注术语或概念的定义。“但
是,我们必须首先界定我们的术语”是本质主义
者常用的一个口号。“某理论性概念的真正含义
是什么”这种理念似乎意味着,当一个词被当作理论中的概念使用之前,我们必须对这个词的使
用所涉及的所有潜在语言问题有一个全面且清晰
的理解。事实上,这正好与科学家的工作方式相
反。在对物理世界开展研究之前,物理学家不会
花费气力讨论如何使用“能量”一词,或者当我们
讨论物质的基本组成时,“粒子”一词是否真正表
达了我们要表达的本质含义。
在科学领域里,确定某概念的意义,是在与
该术语有关的现象得到一定程度的研究之后,而
非研究之前。一个精确的概念性术语来自科学过
程中固有的那种数据和理论间的相互作用,而不
是关于语言用法的辩论。本质主义者让我们陷入
无休止的文字争论,而许多科学家坚信这样的文
字游戏使我们脱离了事物的实质。例如,对
于“生命一词的真正含义是什么”这个问题,两个
生物学家给出的令人惊讶的回答是“没有什么真
正的含义,它只是足够好地满足我们生物学家工
作需要的一种用法,并不是争论或辩驳的主
题”(Medawar Medawar, 1983, pp. 66-67)。总
之,科学家的目的是解释现象,而非对措词进行
分析。在所有的科学学科里,进步的关键在于放
弃本质主义,接受操作主义。这正是本章中我们
探讨的主题。操作主义者将概念和可观测的事件联系
在一起
那么,如果不是来自语言文字的争论,科学
中概念的含义又来自哪里呢?正确使用某一科学
概念的标准是什么?为了回答这些问题,我们必
须讨论操作主义。它对于在科学领域中建构理论
至关重要,尤其对于评估心理学中的理论及观念
具有重要作用。
尽管操作主义形式多样,但是对于科学信息
的使用者来说,用最宽广的思路去思考操作主义
是最有效的。“操作主义”只是这样一种思想:科
学理论里的概念必须立足于可观测事件,或与可
观测事件相关联,而这些可观测事件是可以被测
量的。将概念与可观测事件相联系的是概念的操
作性定义,这使概念公开化了。操作性定义使得
概念从个人化的感觉和直觉中分离出来,并且允
许任何实施可测量操作的人对概念进行检验。
例如,把“饥饿”这个概念定义为“我胃里不好
受的感觉”,并不是一个操作性定义,因为它与
个人对于“不好受的感觉”的体验相联系,因此不
能被其他观察者知悉。相反,涉及一些可测量的
食物剥夺时间或者像血糖水平这样的生理指标的定义才是可操作性的,因为它包含了任何人都可
以实施的可观测的测量。同样,心理学家不同意
将“焦虑”定义为“我不时会感到的不舒服和紧
张”,而是必须用像问卷和生理指标测量这样的
操作来定义概念。上述那个定义是个人对身体状
况的解释,他人无法复制;而后者则是把概念放
在公共科学领域进行解释。
在科学领域里,定义一个概念靠的是一系列
操作,而非单独的行为事件或任务,意识到这点
非常重要。相反,一些差别细微的任务和行为事
件通常聚合在一个概念上(在第8章我们将会更
多地讨论聚合性操作)。例如,教育心理学家根
据利用诸如《伍德库克阅读能力量表》之类
(Woodcock, 2011)包含一系列任务的标准化工
具测得的成绩来定义“阅读能力”这个概念。该量
表测出的阅读能力总分包含了一些不同分量表测
得的能力指标。这些分量表测查的能力稍有不
同,例如,阅读一篇文章、想出一个合适的单词
在文章中填空、写出一个词的同义词、独立拼读
一个较难的词,等等。所有这些任务上的表现综
合地定义了“阅读能力”这个概念。操作性定义促
使我们认真地、经验性地思考我们如何定义一个
概念,所谓经验性,是指要根据我们对真实世界
的观察。试想,我们要给一个看起来相当简单的
概念“打字能力”下一个操作性定义。想象一下你这么做是为了比较两种打字教学方法的优劣。思
考一下你所要做的所有决定。当然,你想要测
量“打字速度”。但是要打多长的一段文章呢?仅
有100个单词的文章可能太短,而10000个单词的
文章又似乎太长。那么到底多长才算好呢?打字
速度维持多久才最符合我们对打字能力这一概念
的理论建构?用什么类型的文章来测试呢?文章
是否要包含数字、公式和不常见的间距?我们如
何处理错误?当我们测量打字能力的时候,时间
和错误似乎都应被考虑在内,但是如果把这两个
指标同时考虑进去的话,要如何来计算一个总分
呢?我们想要让时间和错误具有相同的权重,还
是一个比另一个更重要?寻求一个好的操作性定
义会迫使你认真考虑所有这一切:它会让你对如
何将“打字能力”进行概念化做一番透彻的思考。
考虑美国食品和药物管理局(the Food and
Drug Administration, FDA)的任务,他们决定什
么是各类食物“不可接受”的污染水平,什么被认
为是食品中“不可避免的缺陷”(Levy, 2009)。作
为FDA这样的联邦机构也不能够依靠主观作出判
断。这需要在检查每种食物时,对每种污染物的
操作定义进行严格规范。例如,它构建了以下类
型的操作定义(Levy, 2009):番茄汁中“不可接
受”的污染水平是每100克中超过10个苍蝇卵,蘑
菇中“不可接受”的污染水平是每100克有五个以上的2毫米以上的蛆。简单粗暴却极具操作性!
信度和效度
对一个概念下操作定义包括测量:通过一些
法则给观测结果赋值。科学作家查尔斯·塞费
(Charles Seife, 2010)指出,当我们在测量使用
数字时,我们才突然开始重视它们。他认为,如
果数字不作为抽象符号使用,非数学家几乎不关
注数字的性质。我们不会关注数字5本身。但是
一旦数字5变成“5磅”或“5美元”,或是“通货膨胀
率为5%”,又或是“智商5分”——突然之间,我们
便开始关注这了。塞费(2010)说:“没有单位
的数字是抽象而缥缈的。有了单位,它获得了意
义,但是同时它也失掉了自身的纯粹
性”(p.9)。赛费所说“失去纯度”的意思是一旦
涉及测量,就是说给数字附加单位,我们突然关
心数字的“正确”性质。在科学上,什么是数字
的“正确”性质呢?这个问题的答案是,在科学
上,数字应该有的“正确”性质是信度和效度。
概念的操作性定义要想有用,必须同时具备
信度和效度。信度是指测量工具的一致性。如果
你对同一概念进行多次测评,是否能够得到相同的测量结果。信度的科学概念很容易理解,因为
它与常识中的定义以及字典里的定义非常相
似:“任何总能够产生相同结果的系统所具备的
一种属性”。
试想一下,一个外行人士会如何评价一件事
是否可信呢?想象一个每天早上要赶公共汽车从
新泽西去曼哈顿上班的人。按照时间表,公共汽
车每天应该在上午7:20到达此人等车的站点。在
一个星期中,如果公共汽车到达的时间分别是
7:20、7:21、7:20、7:19和7:20, 那么我们就可以
说在那一周汽车的到达时间是可信的,如果下周
汽车到达的时间分别是7:35、7:10、7:45、7:55和
7:05, 那么我们就可以说在那一周汽车的到达时间
是非常不可信的。
在科学领域中,一个操作性定义的信度以类
似的方式来评估。如果我们多次测量同一概念得
到的结果是近似的,那么我们就说测量工具表现
出较高的信度。如果在同一星期的周一、周三和
周五,用同一IQ测验的不同版本测量同一个人的
智力,得到的分数分别是110、109、110, 那么我
们可以说这一IQ测试是非常有信度的。相反,如
果三个测试分数分别是89、130和105, 那么我们
就可以说这一IQ测试没有显示出高信度。有一些
专门的统计方法可以评估不同类型的测量工具的信度,所有标准的方法论入门教材中都有介绍。
但是请记住,信度仅仅是指前后一致,而不
包括其他内容。对于一个操作性定义而言,仅有
信度是不够的,信度是一个必要而非充分条件。
作为一个好的操作性定义,操作必须被证明对于
概念来说是有效的测量。“结构效度”这个术语是
指一个测量工具(操作性定义)是否测量了它本
应测量的内容。保罗·考兹比教授(Cozby, 2012)
在其所著的方法论教材中为我们讲述了一个只有
信度而没有效度的搞笑例子。假设你想测测自己
的智力,测试者让你站到一个类似鞋码器的测试
仪器上,然后仪器给出一个读数。当然,你会认
为这是一个笑话。但是请注意,这个测量工具可
以显示许多类型的信度,而这些信度在方法论教
材中都会讨论到。这个仪器在星期一、星期三和
星期五会呈现出相当一致的读数(这称之为“重
测信度”),并且无论谁操作它,它都会给出一
样的读数(称之为“评分者信度”)。
用鞋码器来测量智力,其问题不在于信度
(这是有信度的),而在于效度。它不是一个测
量其本应测量的概念(智力)的合理方式。断定
它不是测量智力的有效方式的证据之一,就是我
们发现它和其他一些被认为与智力相关的变量无
关。鞋码器的测量结果与学业成就无关,与脑功能的神经生理学测量无关,与职场成功无关,与
认知心理学家提出的信息加工效率的指标无关;
相反,真正的智力测验与所有这一切都有关
(Deary, 2001; Deary et al., 2008; Duncan et al.,2008; Flynn, 2007; Geary, 2005; Hunt Carlson,2007; Lubinski, 2004)。在心理学领域,真正的
智力测验要兼顾效度与信度,而智力的鞋码器测
验只有信度而没有效度。
在这一点上,你可能想知道信度和效度的其
他组合方式是否可行。因此,让我来重申一下我
们的立场。在操作性定义中,我们寻求信度和效
度兼备,因此高信度和高效度结合才是理想的目
标。我们刚刚讨论了鞋码的IQ测试,目的是论证
高信度和低效度是没用的。第三种情况是低信度
和低效度,这绝对没有用,因此不值得讨论。但
是你可能想知道第四种,也就是最后一种可能的
组合方式:如果高效度和低信度又怎么样呢?答
案是和低效度和高信度的例子(鞋码器例子)一
样,这种组合也是没用的。事实上,更准确的说
法是,这类情况压根儿不可能出现。因为,如果
不能进行可信的测量,你根本无法宣称测量是有
效的。
当形成有效的操作定义时,精确我们要测量
的概念是十分重要的。例如,美国橄榄球联赛(NFL)中评价四分卫时会用到“传球评
分”(passer rating)这个指标(Sielski, 2010)。
意识到这个指标被精确地确定为“传球评分”很重
要。也就是说,它很明确不是四分卫评分指数。
那是因为“传球评分”的操作定义把只是四分卫传
球而不是四分卫做的每件事情考虑了进去。具体
地说,传球率是一个数学公式,包括四个方面:
完成传球百分比、每次传球尝试的码数、每次传
球尝试的触地得分、每次传球尝试的拦截。传球
评分指数统计数值不包括:四分卫跑的码数、呼
叫战术能力、胜负记录、在争球线后抱摔、掉球
和其他一些可量化的四分卫变量。为此,在另一
个操作定义下的叫做“四分卫总评分”的概念产生
了。
直接和间接的操作性定义
概念和可观测的操作之间的联系,在直接和
间接性程度上变化很大。很少有科学概念几乎完
全是通过可观测的操作来定义的。大部分概念的
定义采用更为间接的方式。例如,一些概念的使
用既取决于一系列的操作,又取决于它和其他概
念之间的特殊关系。最后,还有一些概念不通过
可观测的操作直接定义,而是通过它与另外一些概念间的关系来定义的。这种概念有时被称
为“潜在概念”,在心理学中非常普遍。
举个例子来说,许多研究关注所谓的A型行
为模式,因为它与冠心病的发病率有关(Chida
Hamer, 2008; Martin et al., 2011; Matthews, 2005;
Smith, 2003; Suls Bunde, 2005)。在第8章中,我
们将会更加详细地讨论A型行为模式。但是,这
里重点要说的是,A型行为模式实际是通过一系
列二级概念来定义的:强烈的竞争欲望、潜在的
敌意、赶时间行为、达成目标的强烈驱力,等
等。然而,每一个用于界定A型行为模式特征的
概念本身也都需要操作性定义。事实上,研究者
们已经为对每个概念进行操作性定义而付出了很
多努力。我们讨论的要点是,A型行为模式是一
个复杂的概念,它并不是被操作所直接定义的。
相反,该概念与其他一些各自具有操作性定义的
概念联系在一起。
A型行为模式提供了一个间接操作性定义的
例子。在临床心理学上,有一个相似的概念定义
是痛苦耐受性(Zvolensky, Vujanovic, Bernstein,
Leyro, 2010)。这个整体的概念由几个简单的依
赖于操作测量的子概念构成:对不确定性的容忍
度、歧义容忍度、挫败容忍度、负面情绪容忍度
以及身体不适容忍度。简而言之,尽管不同的概念与可观测操作的
联系程度各有不同,但所有的概念都在一定程度
上通过其与可观测操作之间的联系来获得意义。
科学概念的演进
一个科学概念的定义并不是固定不变的,而
是随着相关观测结果的不断丰富而发生变化。意
识到这一点非常重要。如果一个概念的原始操作
性定义在理论上被证明是无效的,那么该定义就
会被抛弃,以另外一套定义的操作取而代之。这
样,随着相关知识的积累,科学概念不断演进,其抽象性逐渐增加。例如,在一段时间里,人们
认为电子是一个围绕原子核旋转的带负电的微小
球体。而如今,电子被视为在特定实验条件下,具有似波特性的概率密度函数。
在心理学领域,智力概念的发展提供了一个
类似的例子。起先,智力仅有一个严格的操作性
定义:智力是通过心理功能测验所测到的东西。
随着实验证据的不断积累,智力被证明与学业成
就、学习、脑损伤、神经生理学及其他行为和生
物学变量有关,这一概念在逐渐丰富的同时又得
到了提炼(Deary, Penke, Johnson, 2010; Duncanet al., 2008; Sternberg Kaufman, 2011)。现在看
来,在定义智力概念时,最好用一种高等级的建
构,通过多种更为具体的信息加工操作来定义。
当然,这些假设的信息加工过程应该具备更为直
接的操作性定义,可以用可测量的指标来表述。
人类记忆理论中的概念也以同样的方式发
展。现代心理学家很少使用类似“记忆”或“遗
忘”这样的笼统概念;相反,他们测量那些可以
进行明确定义的记忆子过程,如短时听觉记忆、符号存储、语义记忆以及情景记忆。传统的“记
忆”或“遗忘”的概念通过更加明确的操作性概念得
到了细化。
因此,理论术语的用法在科学实践中不断演
进,而不是在针对文字意义的争论中获得发展。
这是科学的操作态度和本质主义者在追求绝对定
义之间最显著的区别。哲学家保罗·邱吉兰德
(Churchland, 1988)强调,在科学中,对概念的
定义不是源于文字界定,而是源于与之相关的观
察和其他概念:
要想完全理解“电场”这个概念,我们
就必须熟悉这一表述所处的理论原则体系,它们会共同告诉我们,电场是什么、做什
么。这是一个典型的例子。通常来讲,理论性术语的意义不是从单一的、具体描述其所
适用的必要充分条件的定义中获得的,它们
往往通过所在的理论原则体系而被间接地定
义。(p. 56)
随着科学概念的演进,概念常常与许多不同
的理论体系交织在一起,并且获得多种操作性定
义。这种情况的出现并不是因为概念本身出了问
题。例如,许多人认为心理学不可信,因为心理
学中许多重要的理论概念——例如智力,可以用
不止一种方法来操作化和概念化。但这种情形并
非心理学所独有,也不是一件令人绝望或束手无
策的事情。事实上,在科学领域里,这种情况是
普遍存在的。例如,“热”既可以从热力学理论,也可以从动力学理论的角度来概念化。物理学并
未因此遭到贬斥。想想电子,它的许多特性都是
以波的概念来解释的。可是,如果将其视为粒
子,它的另外一些属性则更好理解。到目前为
止,还没有一个人会因为物理学中存在着这些多
重概念化现象就提出要抛弃它。
2006年,人们在这一点上有了深刻的认识。
当时媒体报道国际天文联合会(International
Astronomical Union)对“行星”的定义重新进行了
操作化,并将冥王星排除在外(Adler, 2006;
Brown, 2010)。像“行星”这样基础的概念都会发生变化,确实让公众大为震惊,但这在科学领域
是司空见惯的。在行星定义这件事儿上,一些天
文学者倾向于强调天文主体的构成和地质因素;
另一些天文学者则强调行星的动力属性,例如它
们的轨道和重力影响。在前一组天文学家的操作
性定义中,冥王星是行星,而在后一组天文学家
的操作性定义中,冥王星则不是行星。不同的操
作性定义反映的不是天文学界的混乱,它们只是
反映从不同角度定义概念的方式。在心理学上也
是一样,一个概念也有许多可选择的操作性定
义。有些事物难以定义,并不代表没有可研究的
东西。心理学领域的操作性定义
许多人在思考物理学或化学的时候,能够理
解操作主义的必要性。他们知道,如果科学家准
备谈论某一类型的化学反应、能量或者磁场,就
必须有相应的方法来测量。不幸的是,当人们谈
到心理学的时候,却经常无法认识到操作主义的
必要性。为什么人们没有同样地认识到这一显而
易见的事实:为了成为科学理论中有用的解释体
系,心理学术语必须被直接或间接地操作化定
义?
人们对心理学产生误解的原因之一,就是心
理学上所说的“预设偏见”。在第1章中,我们提
到过这个问题。人们不会因为执着于某种关于岩
石性质的信念来研究地质学,而在心理学中,情
况就大为不同了。我们每个人都有关于人格和人
类行为的直觉理论,我们用它们来“解释”自己以
及他人的行为。我们所有的个人心理学理论里都
包含着理论性概念(例如聪明、攻击和焦虑)。因此人们会很自然地发问:“为何我们必须接受
一些其他的定义?“尽管这种态度从表面上看来
是合理的,但对于任何致力于理解人类行为的科
学来说,它都是一个巨大的障碍,也是公众对心
理学产生困惑的一个原因。
误解产生的最主要原因,就是心理学中的许
多专业概念都是用日常用语来表达的,这也是媒
体在准确呈现心理学成果方面最大的障碍。这些
日常用语为大量误解的传播敞开了大门。外行人
很少意识到,当心理学家把“智力”、“焦虑”、“攻
击”、“依恋”等词语当作理论性概念来使用时,它
们的含义和大众平常所说的意思不一定相同。
从之前关于操作主义的讨论中,就能看出这
种区别的本质。当在心理学理论中使用如“智
力”、“焦虑”这些术语时,它们直接或间接的操作
性定义决定了它们的正确用法。那些定义常常具
有高度技术性,通常具有特定意义,并且在许多
方面都不同于这些术语在日常生活中的运用。例
如,当我们听到“对大样本的认知任务进行因素
分析所得到的第一个主成分”这段话时,许多人
都意识不到它是术语“智力”的操作性定义。
同样,如果外行人使用术语“抑郁”,那就意
味着“感觉糟透了”。相反,在《精神疾病诊断与统计手册》(Diagnostic and Statistical Manual of
Mental Disorders)中,对抑郁 ......
您现在查看是摘要介绍页, 详见PDF附件(1821KB,458页)。