超级思维:人类和计算机一起思考的惊人力量.pdf
http://www.100md.com
2020年4月25日
第1页 |
第10页 |
第14页 |
第26页 |
第34页 |
第97页 |
参见附件(4792KB,268页)。
超级思维是作者托马斯·W. 马隆写的关于思维的书籍,主要讲述了超级思维的概念,以人工智能的发展为例表达了发散和拓展思维的重要性,可以更高效地解决问题。
超级思维内容
《超级思维》从集体智能的历史讲起,讲述了超级思维在我们这个星球上的发展历程。更重要的是,《超级思维》列举了几十个生动的真实案例,从亚当·斯密《国富论》中的别针工厂,到脸书、谷歌、维基百科、推特等网络社区,再到亚马逊的“土耳其机器人”和麻省理工学院的气候合作实验室,这些案例极具说服力和感染力地向我们展示出一幅超级思维让世界、企业、组织、生活,以及你我变得更智能的美好图景。
《超级思维》得到了多个行业、多个领域的大咖点赞推荐。他们是:麦肯锡全球研究院院长詹姆斯·曼尼卡,麻省理工学院媒体实验室主任伊藤穰一,科幻小说作家、雨果奖获得者弗诺·文奇,谷歌公司副总裁、“互联网之父”温顿·瑟夫,麻省理工学院人工智能实验室前主任帕特里克·温斯顿。
作者简介
托马斯·W. 马隆(Thomas W. Malone)
美国麻省理工学院斯隆管理学院的帕特里克·麦戈文管理学教授,信息技术教授,工作与组织研究教授。他也是麻省理工学院集体智能中心的创办者和负责人,以及麻省理工学院“创造21世纪的组织”项目的两位联合创始人之一。
他着有《工作的未来》(The Future of Work)一书,还写作了100多篇文章、研究论文和书籍章节,他还是4家软件公司的联合创始人、11项专利的发明者和4本图书的合编者。
书籍精彩内容
通用智能,在不同的环境中有效实现各种不同目标的能力。
这个定义与前文中提到的52位心理学家给出的定义相似,而且智力测验衡量的就是这种智能,而不只是评估你有效完成一些特定任务的能力。事实上,测验中的这些任务都是精心挑选的,以便对你完成测验之外的很多其他任务的能力进行预测。
比如,在智力测验中得分高的人通常比其他人更擅长阅读、写作、算术和解决许多其他类型的问题。当然,一个长期从事某项特定工作——比如修理本田汽车——的人,很可能要比一个更聪明却从未打开本田汽车引擎盖的人更擅长修车。但是,更聪明的人往往也更善于快速学习新事物和适应新环境。
在下一章中,我们将会看到更多有关这个定义的内容,但这里有一个关键点,那就是通用智能的定义要求智能行为体不仅擅长完成某项特定任务,还善于学习如何完成各项不同的任务。简单地说,这个定义与“多样性”或者“适应性”的意思大致相同。那么从这个角度说,一般的集体智能就是“团队多样性”或者“团队适应性”。
专业智能与通用智能之间的差异,有助于我们辨别现在的计算机与人在能力方面的差异。在专业智能方面,目前的一些人工智能计算机比人要聪明得多。比如,在执行像下棋或玩Jeopardy(危险边缘)益智问答游戏这样的具体任务时,计算机就比人的表现好。但是,不管它们多么擅长完成这些特定的任务,目前计算机的通用智能水平都远不及任何一个5岁的正常人。比如,现在没有一台计算机能像一个普通的5岁孩子那样顺畅地谈论问题,更不用说这个孩子还会走路、捡起奇形怪状的物体,以及看出别人是否开心、难过或生气。
所以,当我走在办公室附近的街道上(或者其他任何地方)时,会看到很多超级思维。要想识别它们,我需要确认4个要素:第一,一群个体;第二,这些个体正在采取某些行为;第三,这些行为之间存在的某种相互联系;第四,我们评估这些行为时的参照目标。每当我看到这4个要素组合在一起时,我就能找到一个超级思维。不过有一点很重要,那就是识别超级思维的过程有时很有用,有时则不然。比如,我可能会说办公桌的4条腿构成了一个群体,共同防止桌面掉落到地上。就其本身而言,这句话并没有错,而且从这个角度看,我的桌子就是一种极其简单的超级思维。但是,把超级思维的概念以这种方式应用于我的桌子或许效用很小,因为我们并不能从中获得一点儿有关如何使用桌子或做其他任何事情的新见解。
正如物理学家需要学习如何巧妙地运用像力、质量和能这样的概念,去有效地认识真实的物理情景一样,我们也需要学习如何巧妙地运用超级思维和集体智能的概念,去真正理解现实世界。
超级思维:人类和计算机一起思考的惊人力量截图
书名:超级思维
作者:[美]托马斯·W.马隆
译者:任烨
ISBN:9787521709209
中信出版集团制作发行
版权所有·侵权必究献给我的父母
欧内斯特·马隆(Ernest Malone)
和
维吉尼亚·马隆(Virginia Malone)前言
在英语中,“supermind”(超级思维)这个词的意思是“多种个体思维形成的
强大组合”。 本书要讲述的正是超级思维在我们这个星球上的发展历程。我们会
看到人类的历史在很大程度上就是人类超级思维的历史,也就是以群体(比如层级
制、社群、市场和民主制)为单位的人,如何完成了仅凭一己之力绝不可能做到的
事情。
更重要的是,我们还会看到计算机将对人类超级思维的未来发展产生多么关键
的影响。在很长一段时间里,计算机最重要的贡献不是人工智能,而是“超级连
接”(hyperconnectivity),即以全新的方式和空前的规模将人类的思维彼此连接
起来。不过随着时间的推移,计算机也会完成越来越多如今只有人类才能胜任的复
杂思考。
本书探讨的主要内容并不是计算机将如何完成人类过去常做的事情,而是人类
和计算机将如何共同完成以前绝不可能做到的事情,人机超级思维又将如何成为我
们这个世界有史以来智能水平最高的工具,以及我们将如何利用这些新型的集体智
能来解决企业、政府和其他社会领域中的一些最重要的问题。
1. Collins English Dictionary, s.v.“supermind,” accessed April 30, 2017,https:www.collinsdictionary.comusdictiona.ryenglishsupermind.引言
2009年1月,蒂姆·高尔斯(Tim Gowers)发布了一则创造历史的博客。高尔斯
是剑桥大学的数学教授,证明数学定理就是他谋生的方式。如果你像大多数人一
样,那么你可能一辈子都没有证明过一条定理;或者至少在上完高中的几何课之
后,再也没有证明过一条定理。然而,数学证明展现出来的严谨的逻辑思维,正是
人类的很多最重要的科技成就得以实现的关键。
通常,证明定理需要独立工作好几个小时,才能想出如何完成一个复杂证明的
某个部分的一个片段。2009年,高尔斯决定尝试用一种不同的方式来做这件事,他
想看看互联网上的大量用户能否一起证明一条定理。
在一篇题为《大规模协作的数学运算有可能实现吗?》的博客文章中,高尔斯
向互联网上所有对协作证明定理感兴趣的人发出了邀请。 他推测这种大规模的协
作可能会有用,原因至少有以下三点。第一,在各种解决问题(包括数学证明)的
过程中,运气往往很重要。让很多人来解决一个问题,可以增加有人走运并想到好
主意的概率。
第二,不同的人了解的知识不同。所以,即使所有人都只提出对他们来说显而
易见的观点,整个群体能获取的知识也比一两个人能获取的知识多得多。
第三,不同的人有不同的思维方式。有些人善于提出可供尝试的新点子,有些
人善于在别人的想法中寻找漏洞,还有些人则善于将大量的碎片整合成条理连贯的
新观点。正如高尔斯在博客中概括的那样,“……如果一大群数学家的头脑能有效
地连接起来,或许他们能更高效地解决问题”。
接着,高尔斯又提出了几条能让协作变得更加简单的基本规则,比如讨论时保
持礼貌,发言简洁精练。在随后的一篇博客文章中,他发布了证明黑尔斯–朱厄特
(Hales-Jewett)定理的任务,该定理是应用于计算机科学及其他领域的一个只有
少数人了解的数学分支的一部分。很快,其他数学家就接受了高尔斯的挑战。在高尔斯发布这篇博客文章后不到7
个小时,加拿大不列颠哥伦比亚大学的数学家约瑟夫·索利摩斯(Jozsef
Solymosi)就发表了第一条评论。15分钟后,美国亚利桑那州的一位高中数学教师
詹森·戴尔(Jason Dyer)发表了第二条评论。又过了3分钟,加州大学洛杉矶分校
的陶哲轩(Terence Tao,他和高尔斯都获得过相当于数学界的诺贝尔奖的菲尔兹
奖)也发表了评论。
到2009年3月中旬,参与者已经解决了这个问题的核心部分。到5月底,在1 500
多条评论中,有39人的发言具有实质性意义。10月,该团队发表了描述他们研究成
果的第一篇论文,而且他们所有论文的署名都是“D. H. J. Polymath”,这是为整
个团队起的一个笔名。
由于有多位著名的数学家参与其中,所以你可能会怀疑这到底是不是一个团队
项目,或者说关键工作是不是由少数最具名望的参与者完成的。事实上,尽管团队
中的一些成员做出的贡献的确比其他人大,但在对项目的所有工作记录进行详细分
析后,我们发现39位主要参与者中的几乎每个人都贡献了有影响力的观点。
换句话说,博学项目(Polymath Project)创造了历史,因为这是由几十位互
联网用户组成的松散团队,在数学领域做出真正贡献的第一个案例,他们中的很多
人在项目开始之前互不相识。
古老的思想渊源
博学项目的成功得益于利用了新的信息技术,以过去完全不可能的方式把人联
系在一起。在本书中,我们将会看到很多这样的例子:庞大的在线群体创作出一
部“百科全书”(维基百科),解决科学难题(蛋白质折叠电子游戏Foldit),彼
此闲聊(脸书),以及对像飓风这样的人道主义灾难做出响应(非营利性危机预警
平台Ushahidi)。
但在某种意义上,这些数字时代的成就都只印证了人类文明史中的一个最古老
的故事。这个故事是这样的:“出现一个问题,不同的人负责处理这个问题的不同
部分。总的来说,比起个人的单打独斗,群体能更好地解决问题。”事实上,毫不夸张地说,我们的几乎所有重要的问题都是由群体解决的,而不
是仅凭一己之力完成。比如,人们也许常说史蒂夫·乔布斯发明了iPhone(苹果手
机),但实际上iPhone无疑是由世界各地的几千人设计和制造出来的,而他们依靠
的也是前人留下的诸多技术发明。哪怕只是制作我今天午餐要吃的火鸡三明治,也
需要几百人来种植、运输和准备肉类、面包、生菜、芥末和其他原料。
与这些“简单”的问题相比,像如何应对气候变化、犯罪、战争和贫困,以及
如何改善医疗保健和教育之类的社会问题复杂得多,需要的人力也多得多。
在有助于有效解决问题的能力中,有一种叫作智能,而且我们通常认为智能是
个体拥有的一种能力。但我们从前文的所有例子中可以明显看出,从解决问题的意
义上说,智能也可以是群体拥有的一种能力。
我们把群体的智能称为集体智能,本书要讨论的就是这种无处不在却常常被忽
视的智能。我们将会看到,最先将人类的祖先和它们的动物近亲区别开来的东西正
是人类的集体智能,而不是人类的个体智能。我们将会看到,人类的进步主要是由
群体而不是个体完成的。我们将会看到,随着时间的推移,信息技术(比如书写和
印刷)使得群体规模显著增大,智能水平也大幅提高。
最重要的是,我们将会看到,人类目前正处于集体智能的另一次巨变的早期阶
段,触发这次变革的是电子信息技术。不过,在想象集体智能的未来发展之前,我
们有必要先简要地回顾一下它的过去。
集体智能简史
我们做一个思想实验:想象你搭乘着时间机器来到公元前45 000年非洲的一片
热带雨林。尽管你的知识水平和现在一样,但你却是孤身一人。天气炎热、潮湿,四周还传来很多奇怪的声响。如果你走运,或许能依靠水果、坚果和其他食肉动物
留下的猎物尸体,以及你偶尔抓到的鱼或者蚱蜢活下来。不过,你终将成为食物链
的一环,一直活在对比你强大的捕食者的恐惧中。 例如,如果你偶然碰到一头饥
饿的狮子,那么你很可能会成为它的午餐,而不是你吃掉它。
我们人类的远祖也曾面临这样的境况,但主要的区别在于,远古人类并不是孤身一人,而是过着群居生活。事实上,他们的大脑天生就有建立相互联系的能力。
相较于与人类体型相似的动物的大脑,人类的大脑是目前动物界中最大的。而且,在多出来的脑容量中,有很大一部分似乎就是服务于社交智能的。
如果你检视包括猴、猿和人类在内的所有灵长类动物,就会发现新皮质区域越
大的物种,形成的社会群体也越大。 有效融入更大的社会群体的能力,是人类大
脑的最重要的进化优势之一。
这背后最主要的原因或许是,群体比个体能更有效地保护他们免受捕食者的伤
害。 群体中的少数人可以在其他人吃杧果的时候,密切注意狮子的动向。狮子也
不太可能攻击一大群人,因为它知道即便能轻易地制服一个人,也很可能在与十几
个人的战斗中失败。当人类成为捕食者时,庞大的群体变得更加有效。比如,由几
十个人组成的群体可以把一整群野马团团围住,然后将它们赶进峡谷,一网打尽。
除了卓越的社交智能外,早期人类还发展出比其他动物更丰富的沟通方式。这
些人类语言不仅可用于协作狩猎,还可用来分享创意,例如,怎样控制火,怎样制
作弓箭,以及怎样造船。
即使那些会取火的“阿尔伯特·爱因斯坦”——不管他们是谁——如果无法将
他们掌握的技术传播给别人,也不会给这个世界带来多大的改变。他们的创新之所
以有影响力,只是因为他们的创意为很多人和群体共享,后者可以进一步应用和发
展它们。
在30 000~70 000年前,我们人类的祖先已经拥有了与现代人类别无二致的身体
和大脑, 并凭借他们的能力在世界上占据越来越高的地位。例如,人类在大约45
000年前到达澳大利亚海岸。之后在几千年的时间里,这片大陆上其他24种体型最大
的动物中有23种已经灭绝了。
虽然我们没有任何关于人类屠杀动物的目击报告,但以狩猎采集为生的人类祖
先最终还是以某种方式到达了食物链顶端。而且,成为顶级捕食者的是人类群体,而不是个体。
农业类似的故事也发生在人类的另外两个主要发展阶段:农业革命和工业革命。在
大约12 000年前,人类开始系统地培育小麦、玉米、奶牛和其他很多动植物。这使
得全球人口从大约200万增长到1700年的6亿,进一步巩固了人类对大自然的其他部
分的统治。
但是,农业比狩猎和采集需要更多和更大规模的群体协作。农民种植粮食,但
他们通常不会自己盖房子,盖房子的木匠又需要从农民那里获取粮食。于是,人们
就在市场上用他们拥有的东西来交换他们需要的东西。随着农业社会的发展,庄稼
和房屋也需要保护,免受侵略者和窃贼的破坏。在这个问题上,人们通常会依赖于
由国王和皇帝统治的政府。
上述成就全都依赖于人类的集体智能和技术,仅凭一己之力根本不可能做到。
像书写这样的信息技术尤为重要,因为它们让原本不可能实现的跨越时空的沟通成
为现实。
工业
从18世纪开始,随着人类开办工厂、发明机器,工业时代的大幕被缓缓拉开,劳动分工和各种各样更复杂的协作得到了进一步发展。与新的分工方式相结合的新
技术使生产率得到大幅提升。比如,经济学家亚当·斯密就曾以著名的大头针工厂
的例子来说明劳动分工的重要性。在这家工厂里,原先一位制针工人要完成的任务
被分解成切断金属丝、打磨针尖等18项单独的任务,而且每一项任务都由不同的专
业工人来完成。在更大规模的群体当中,这样的分工方式可以大大地提高生产率。
在工业时代,除了规模更大的市场和政府,还出现了规模更大的社群,比如世
界科学界,让新的互动方式成为可能。这些变化都依赖于信息技术的进一步发展,包括印刷术和我们今天知道的各种电子通信技术。所有这些进步的结果是,世界人
口再次增长,仅在过去的300年里就从6亿增加到70多亿。人类对地球的统治如此成
功,以至于现在人类自身也许才是地球未来的最大风险。
同样地,这些发展也不只是人类个体智能的结果。大概没有一个人会说:“我
希望人口能够尽可能地增加,这样一来,人类就可以统治大自然了。”事实上,这
些结果无论好坏,都是人类的集体智能和技术共同造就的。集体智能到底是什么?
把由人和计算机组成的群体视为一种超个体,也许看起来就像一个富有诗意的
隐喻。但我们将会看到,这个观点从很多方面来说都是相当准确的。事实证明,人
类群体和人类个体一样,都有可进行科学测量的属性。我们将会看到,研究表明,心理学家用来测量个体智能的统计方法也可用于测量群体智能的衡量。在这个过程
中,我们将会看到有些群体确实比其他群体睿智,我们也将更准确地理解其中的原
因。
我们也将看到,我和我的一位同事在研究中采用神经科学家开发的一种用于测
量意识的方法,去分析人机群体中的交互模式。我们发现,最高效的群体也是交互
模式与有意识的人脑最相像的群体。这是不是意味着那些群体真的“有意识”呢?
尽管答案是否定的,但我们将会看到,有很多原因表明这种想法可能并不是痴人说
梦。
我们还将看到,一个群体自身的意愿往往与群体中个体的意愿不一致。比如,即使在对员工没有任何益处的情况下,公司也常会做对其自身利润有益的事情,这
毫不奇怪。民主政府常会做出公民不喜欢的选择;市场会无情地将食物、房屋和其
他各种资源分配给出钱最多的人,即使这样做会让其他人几乎一无所有。
所以,从某种重要的意义上说,这些具有集体智能的“生物”确实拥有超越个
体的“生命”。我们把这种生物称为超级思维。在这里,“超级”并不一定意味
着“更好”,而只意味着“更具包容性”。换句话说,正如超个体(比如,一个蚁
群)包含其他生物(比如,个体蚂蚁)一样,超级思维(比如,一家公司)也包含
其他思维(比如,公司员工的想法)。
和动植物个体一样,超级思维也可以被分成多个“物种”。我们将详细了解以
下4个重要的类别:
层级制:当权者做出决策,其他人必须服从。存在于企业、非营利组织和
政府的运营部门中。
民主制:通过投票做出决策。存在于政府、俱乐部、企业和很多其他群体
中。市场:根据贸易伙伴间的双方协议做出决策。存在于人们进行金钱、商品和
服务交易的任何地方。
社群:通过非正式的共识或共享的规范做出决策。存在于人类生活的方方面
面,从本地社区到职业群体再到国家文化。
所有这些不同类型的超级思维一直在相互作用:有时协作,有时竞争,有时则
彼此毁灭。当你从这个角度看待世界时,你可能会发现今天的新闻大多都与这些不
同类型的超级思维的冒险活动有关。
这里有几个例子:一是以苹果与三星为代表的层级制公司,争夺全球智能手机
市场的主导地位。二是美国民主制度下的自由派与保守派就医疗保健问题到底应该
通过自由市场、政府层级制度还是二者的某种组合才能得到更好解决的议题展开争
论。三是美国最高法院(层级制政府中的一个带有些许民主色彩的部门)就“联合
公民诉联邦选举委员会案”做出裁决,认定大型层级制企业用金钱影响民主选举的
行为是违法的。四是地方社区对层级制政府试图规定跨性别者可使用的洗手间的法
令表示反对。
所有这些事件都发生在最后一种能涵盖其他所有超级思维的背景之下:
生态系统:依据谁拥有最大的权力和最强的生存繁衍能力做出决策。存在
于缺乏总体合作框架的任何地方,比如我们在上文中看到的各种不同类型的超级
思维之间的冲突。
和自然界中的生态系统一样,生态系统超级思维也是按照“弱肉强食,适者生
存”的法则运行的,只有行之有效的超级思维才能获得回报。
这就意味着,不管我们喜欢与否,在任意特定时间存在于某个生态系统的个体
和超级思维,在过去都是强大和成功到足以生存或繁衍的。这种对生存的渴望,或
许就是超级思维有独立于其成员的自我意愿的最重要原因。不过,令人吃惊的是,对超级思维有利的东西往往也对个体有利。
作为个体,我们通常不得不依靠各种各样的超级思维,解决这个世界面对的大
问题。但是,我们有时也能影响既有的超级思维,或者创造出新的超级思维来处理
对我们而言很重要的问题。在这个过程中,我们应该把赌注押在最适合手边问题的超级思维上。为了帮助你做出恰当的选择,我们会对不同类型超级思维的一些关键
的优势和劣势进行分析。
信息技术如何让超级思维变得更智能?
为了弄清楚信息技术将如何改变世界,我们需要理解目前驱动世界运转的超级
思维。不过,我们也需要了解新一代电子信息技术将如何从根本上改变这些超级思
维。
现在,许多人认为最重要的新型信息技术是人工智能(AI),因为它能让机器
人和其他软件程序去做以前只有人类才能做到的事情。当然,像亚马逊公司的
Alexa(人工智能语音助手)和谷歌公司的自动驾驶汽车这样的产品确实越来越智能
了。而且,在未来的某一天,我们有可能会拥有像人类一样聪明和适应性广的人工
智能机器。
但大多数专家都估计,至少在几十年或者更长的时间内它不可能成为现实。在
此期间,我们对人工智能的利用也离不开人类的参与,因为后者能提供机器本身尚
不具备的各种技能和一般智力。
在可预见的未来,信息技术的另一种用途甚至比单纯地创造更好的人工智能更
重要,那就是建立人机群体,并展现出比以往任何时候都强得多的集体智能。
我们常常高估人工智能在这方面的潜力,又常常低估存在于地球上大约70亿个
信息处理能力惊人的人类大脑间的超级连接的潜力,更不用说其他几百万台不包含
人工智能的计算机了。
我们很容易高估人工智能的潜力,因为我们很容易想当然地认为计算机像人一
样聪明。我们已经知道人类是什么样子,而且科幻电影和小说中的很多故事都与智
能计算机有关,比如《星球大战》中的R2–D2(宇航技工机器人)和邪恶的终结者
生化电子人,它们的行为表现就像我们已经了解的好人和坏人一样。不过,要创造
出这样的机器可比想象它们难多了。
另外,我们之所以会低估超级连接的潜力,或许是因为创造出庞大的人机群体
连接网络比想象它们到底能做什么更容易。事实上,到目前为止,我们使用计算机主要是为了与他人联系。在电子邮件、移动应用、网络和像脸书、谷歌、维基百
科、网飞、YouTube视频和推特等这类网站的帮助下,我们已经创造出世界上前所未
有的规模最庞大的人机群体。
但对我们来说,要理解这些群体当下的作用仍然很难,而要想象它们在未来将
如何变化则难上加难。本书的目标之一就是帮你想象各种可能性,以及它们将如何
帮助我们解决最重要的问题。
比如,我们将会看到,信息技术如何帮助我们创建规模更大的群体、更具多样
性的群体、拥有全新组织方式的群体,以及结合了人类智能与机器智能的群体,从
而做到过去绝不可能做到的事情。换句话说,我们要探究的是集体智能的核心问题
之一:
人与计算机如何才能连接起来,并达到任何个人、群体或者计算机都从未达
到的智能水平呢?
超级思维如何帮助我们解决问题?
超级思维要想具备实用性,就必须解决我们关心的问题。为了说明其中的某些
可能性,我们将会看到几个在企业战略规划、应对气候变化和管理人工智能风险的
过程中,如何利用超级思维解决问题的例子。
我们也将看到,在地球上集体智能的发展显然是有终点的,它就是“全球思
维”,即地球上所有人、计算机和其他类型的智能的组合。 我们将会看到,在某
种程度上,全球思维已经存在,而且其智能化水平一直在提高。 最后,本书将针
对我们应该如何利用全球思维做出既聪明又明智的选择进行一些思考。
1. Timothy Gowers and Michael Nielsen,“Massively Collaborative Mathematics,”
Nature 461, no.7266 (2009):879-81,doi:10.1038461879a;Justin Cranshaw and Aniket
Kittur,“The Polymath Project:Lessons from a Successful Online Collaboration in
Mathematics,”in Proceedings of the SIGCHI Conference on Human Factors in Computing
Systems(New York:Association for Computing Machinery,2011),1,865-
74,doi:10.11451978942.1979213.2. Timothy Gowers,“Is Massively Collaborative Mathematics Possible?”Gowers’s
Weblog,January 27,2009,http:gowers.wordpress.com20090127is-massively-
collaborative-mathematics-possible.
3. D.H.J.Polymath,“Density Hales-Jewett and Moser Numbers,”preprint,submitted
February 2,2010,https:arxiv.orgabs1002.0374;D.H.J.Polymath,“A New Proof of the
Density Hales-Jewett Theorem,”preprint,submitted October
20,2009,https:arxiv.orgabs0910.3926.
4. Cranshaw and Kittur,“The Polymath Project.”
5. Yuval Noah Harari,Sapiens:A Brief History of Humankind(New
York:HarperCollins,2015),11.
6. The dimension on which humans excel is called the encephalization quotient.See
M.D.Lieberman,Social:Why Our Brains Are Wired to Connect(New
York:Crown,2013),29;Gerhard Roth and Ursula Dicke,“Evolution of the Brain and
Intelligence,”Trends in Cognitive Sciences 9,no.5(2005):250-
57,http:dx.doi.org10.1016j.tics.2005.03.005;Robin I.M.Dunbar,“Neocortex Size as
a Constraint on Group Size in Primates,”Journal of Human Evolution
22,no.6(1992):469-93,doi:10.10160047-2484(92)90081-J;Robin I.M.Dunbar,“Coevolution
of Neocortical Size,Group Size and Language in Humans,”Behavioral and Brain
Sciences 16,no.4(1993):681-94,https:doi .org10.1017S0140525X00032325;Robin
I.M.Dunbar,Grooming,Gossip,and the Evolution of Language(Cambridge,MA:Harvard
University Press,1998);Robin I.M. Dunbar and Susanne Shultz,“Evolution in the
Social Brain,”Science 317,no.5,843(2007):1,344-47,doi:10.1126science.1145463.
7. Dunbar,“Neocortex Size as a Constraint.”
8. Dunbar,Grooming Gossip,and the Evolution of Language,17-18.
Dunbar gives several examples of primates acting in groups to defend against
predators.But if you are a stickler for the historical plausibility of hypothetical
examples,you may be wondering whether lions and mangoes ever existed together in
ancient times as I posited here.The answer is:they probably did.Lions were common in
Africa,and so were African mangoes.See Wikipedia,s.v.“lion,”accessed February
11,2018,https:en.wikipedia.orgwikiLion;“Historic vs Present Geographical
Distribution of Lions,”Brilliant Maps,April
26,2016,http:brilliantmaps.comdistribution-of-lions;Wikipedia,s.v.“Irvingia
gabonensis,”accessed February 11,2018,https:en.wikipedia.org
wikiIrvingia_gabonensis.
It is less likely that lions would have been in a rainforest,since they
typically inhabit grasslands and savannas.But perhaps the imaginary scenarios
described here took place near the edge of a rainforest or involved unusual lions
who liked rainforests.See Wikipedia,s.v.“lion”;Jeremy Hance,“King of theJungle:Lions Discovered in Rainforests,”Mongabay,August
13,2012,https:news.mongabay .com201208king-of-the-jungle-lions-discovered-in-
rainfore sts.
9. Harari,Sapiens,36.
10. Ibid.,20-21.
11. Large animals are defined as species weighing 100 pounds or more.See detailed
reference in Harari,Sapiens,65n2.
Recent research suggests that humans may have been in Australia for 5,000 to
18,000 years before the megafauna went extinct,but humans are still prime suspects
in their death.See Nicholas St.Fleur,“Humans First Arrived in Australia 65,000
Years Ago,Study Suggests,”New York Times,July
19,2017,https:www.nytimes.com20170719sciencehumans-reached-australia -
aboriginal-65000-years.html.
12. For population estimates used here and in the rest of this section,see Max
Rosner and Esteban Ortiz-Ospina,“World Population Growth,”Our World in Data,April
2017,https:ourworldindata.orgworld-population-growth.
13. Lingling Wei,“China’s Response to Stock Rout Exposes Regulatory Disarray,”Wall
Street Journal,August 4,2015,http:www.wsj.comarticleschinas-response-to-stock-
rout-exposes-regulatory-disarray-1438670061;Keith Bradsher and Chris
Buckley,“China’s Market Rout Is a Double Threat,”New York Times,July
5,2015,http:www.nytimes.com20150706business internationalchinas-market-rout-
is-a-double-threat.html.
14. Peter Russell,The Global Brain:Speculations on the Evolutionary Leap to
Planetary Consciousness(Los Angeles:J.P.Tarcher,1983);Howard Bloom,Global Brain:The
Evolution of Mass Mind from the Big Bang to the 21st Century(New
York:Wiley,2000);Abraham Bernstein,Mark Klein,and Thomas W.Malone,“Programming the
Global Brain,”Communications of the ACM 55,no.5(May 2012):41-
43,doi:10.11452160718.2160731.第一部分
什么是超级思维?第1章
如果你在街上看到它,你能认出超级思维吗?
1776年,亚当·斯密在《国富论》中写道,在市场中谋取自身利益最大化的买方
和卖方,往往也会由市场中的“一只看不见的手”引领,去谋取社会利益的最大
化。例如,你有一辆冰激凌车,假如卖芥末味的冰激凌比卖摩卡味冰激凌能让你获
取更多的利润,那么你的生意也会为社会贡献更多的经济价值。
当然,在某些情况下,谋求个人利益最大化并不意味着社会利益的最大化。不
过,亚当·斯密深刻地意识到,市场中的人际互动常能带来任何个体都无法实现的良
好的总体结果。即使你卖芥末味的冰激凌只是为了赚更多钱,但你也在不经意间通
过使用整个社会的牛奶、食糖、劳动力和其他资源而让更多人感到快乐。亚当·斯密
把市场的这种近乎神秘的属性称作“看不见的手”。
然而,市场不仅有看不见的手,还有看不见的思维。事实上,市场就是超级思
维。尽管超级思维无时无刻不在我们身边,但要看到它们,你必须知道如何看。一
些超级思维,比如公司,通常很容易看出来,而其他超级思维,比如生态系统,则
很难看出来。
我有时会跟自己玩一个小游戏,那就是当我走在街上的时候,数数我能看到多
少超级思维。当我走出麻省理工学院的办公楼,然后左转走向肯德尔广场时,我可
能会看到一个施工队、一家银行、多个商店和餐馆,以及一条虽然拥挤但行人不会
撞到彼此的人行道。
尽管这些都是超级思维,但为了看到它们,我们需要以一种非常特别的方式去
看。为了做到这一点,我们需要了解超级思维的定义。下面这个定义将贯穿全书:
超级思维——以看似智能的方式共同行事的一群个体。
我们也可以把集体智能定义为任何超级思维都具有的一种属性:集体智能——以看似智能的方式共同行事的群体取得的结果。
由于超级思维定义中的每个词都很关键,所以让我们来逐个剖析一下。
一群……
要看到超级思维,我们先得发现一个群体,这通常很容易做到。例如,正在对
我办公室附近的一幢大楼进行改造的施工队,显然是一群人。我有时会去买火鸡三
明治的那家餐馆的店员,也是一群人。
然而,有些群体就不这么显而易见了。例如,走在人行道上的人们并不是一个
你平常会多加留意的群体,但当他们为了避免撞到彼此而(大多)无意识地闪躲
时,在这一刻他们就成了一种超级思维。
个体……
尽管定义说超级思维是由“个体”组成的,但并没有明确说明是哪种个体。这
意味着超级思维中的个体可能很小,也可能很大,而且,他们不仅包含思维,还有
受思维控制的实体和其他资源。
例如,我们可以说我所在社区中的星巴克咖啡店是一个超级思维,它包括店里
的所有员工,还有桌子、椅子、咖啡机和咖啡豆。或者,我们可以说整间咖啡店本
身是一种规模更大的超级思维——包含我所在社区中的所有咖啡商户的市场——中
的个体。或者在较低层面上,我们可以说星巴克的一位咖啡师是一种超级思维,其
个体包括咖啡师大脑中的所有神经元,没错儿,每个人的思维本身就是一种超级思
维。
共同行事……
那么,所有群体都是超级思维吗?不一定。只在其个体采取某种行动时,群体
才是超级思维。例如,你应该不会认为放在地上的咖啡杯组(4件套)是超级思维。
但只采取某种行动的群体也不一定是超级思维,个体还必须共同行事。换句话
说,他们的活动必须是有关联的。两个不同城市的两个不相干的人,即使在同一天
的早晨各自昏昏沉沉地煮着咖啡,也不可能是超级思维。不过,在一家星巴克咖啡店里为了满足顾客的所有需要而一起工作的两位咖啡师,则是超级思维。
这里有一点很重要:尽管个体的行动需要有关联,但一个超级思维中的个体无
须彼此合作或者目标一致。比如,一个名叫创新中心(InnoCentive)的网站,科
学家和技术专家可以在这里比拼破解像如何合成某种特定化合物这样的难题。虽然
解决问题者是相互竞争(没有合作)的关系,但他们的行动也是相关联的,因为他
们都在解决相同的问题。
以看似智能的方式……
最后,只有一群行动有关联的个体仍然不够。要成为超级思维,群体还必须做
看似智能的事情。在定义中,“看似”这个词可能会让你觉得惊讶,因为它听起来
有点儿优柔寡断。但它确实必不可少,因为从某种重要的意义上说,超级思维和美
一样,都是“情人眼里出西施”。
事实上,超级思维的所有元素(即智能、个体、群体、行动和关联)都必须由
观察者来识别。 而且,不同的观察者会用不同的方式来分析相同的情形。例如,你认为每一家星巴克咖啡店本身就是一个超级思维,而我认为每家店只是一个更大
的超级思维的一部分,尽管我们都是对的,但却会对形势产生不同的洞见。
观察者的作用在评判智能方面尤为重要,因为在某种程度上,这往往是一种主
观判断。例如,你评判某个实体是不是智能的,主要取决于你对这个实体试图实现
的目标的看法。当学生做多项选择的智力测验时,我们会假定他们正试图给出出题
人认为正确的答案。但我一下子就想起了我高中时代的一个女同学,她非常聪明但
也非常叛逆,她在做这类测验的时候,很可能会在选择题答题卡的圆圈里画上好看
的花朵图案。如果她真的这样做了,那么通常的测试评分法根本无法测量她的高智
商!
总之,为了评估一个实体的智能水平,观察者必须对这个实体的目标做出假
设。当评估一个群体的智能水平时,将对观察者而言重要的群体目标考虑在内往往
是有帮助的,即使群体中没有个体持有这样的目标。
例如,一座城市中的每辆冰激凌车车主都有各自不同的目标:他们中的大多数
人可能都想赚尽可能多的钱,同时希望拿到经营许可的竞争者少一点儿。如果你在
这座城市的公园管理部门工作,在决定该为多少辆冰激凌车颁发公园经营许可证时,你可能想对游客进行调查,了解他们是否认为自己能买到足够物美价廉的冰激
凌。对由公园里的所有冰激凌车组成的超级思维来说,这些调查是评估其总体智能
水平的一种方法。
最后,需要注意的是,如果我们观察到某个群体试图做智能的事情,即便没有
成功,我们也可以把这个群体视为超级思维。例如,有一家初创软件公司,即使整
个团队竭尽所能,它的产品还是失败了,公司因此倒闭,你也可以把它看作超级思
维。
什么是智能?
那么,我们在前文中提到的智能究竟是什么意思呢?这个术语可以说是出了名
地难把握,不同的人以不同的方式来定义它。 例如,《不列颠百科全书》
(Encydopaedia Britannica)给它的定义是:“有效适应环境的能力。”认知心
理学家霍华德·加德纳(Howard Gardner)把它定义为“解决问题或者创造产品的
能力,而且这些问题和产品在一种或多种文化背景下都受到重视”。此外,一个由
52位知名心理学家组成的团队将该领域内的主流观点总结如下:
智能是一种非常普遍的心理能力,除了其他因素之外,还包括推理、规划、解决问题、抽象思考、理解复杂观点、快速学习和汲取经验的能力。它不只是表
现书本学习、狭义的学术技能和智能测试。更确切地说,智能反映了我们对周遭
环境的一种更广泛与深层次的理解能力,即对事物的“认知”、“了解”,或
者“明白”自己该做什么。
根据本书的主旨,我们将给出两种关于智能的定义,它们各自适用的情况也是
不同的。第一种是专业智能:
专业智能——在给定环境中有效地实现特定目标的能力。
这个定义与上文中提到的《不列颠百科全书》及霍华德·加德纳给出的定义是等
价的。总的来说,它的意思是一个智能实体会根据自己知道的一切,去做任何最有
可能帮助其实现目标的事情。说得更直白一点儿,专业智能就是实现特定目标
的“效能”。从这个意义上说,专业的集体智能就是“团队效能”,超级思维就是一个有效能的团队。
我们要介绍的第二种智能的应用更广泛,往往也更有趣:
通用智能——在不同的环境中有效实现各种不同目标的能力。
这个定义与前文中提到的52位心理学家给出的定义相似,而且智力测验衡量的
就是这种智能,而不只是评估你有效完成一些特定任务的能力。事实上,测验中的
这些任务都是精心挑选的,以便对你完成测验之外的很多其他任务的能力进行预
测。
比如,在智力测验中得分高的人通常比其他人更擅长阅读、写作、算术和解决
许多其他类型的问题。当然,一个长期从事某项特定工作——比如修理本田汽车
——的人,很可能要比一个更聪明却从未打开本田汽车引擎盖的人更擅长修车。但
是,更聪明的人往往也更善于快速学习新事物和适应新环境。
在下一章中,我们将会看到更多有关这个定义的内容,但这里有一个关键点,那就是通用智能的定义要求智能行为体不仅擅长完成某项特定任务,还善于学习如
何完成各项不同的任务。简单地说,这个定义与“多样性”或者“适应性”的意思
大致相同。那么从这个角度说,一般的集体智能就是“团队多样性”或者“团队适
应性”。
专业智能与通用智能之间的差异,有助于我们辨别现在的计算机与人在能力方
面的差异。在专业智能方面,目前的一些人工智能计算机比人要聪明得多。比如,在执行像下棋或玩Jeopardy(危险边缘)益智问答游戏这样的具体任务时,计算机
就比人的表现好。但是,不管它们多么擅长完成这些特定的任务,目前计算机的通
用智能水平都远不及任何一个5岁的正常人。比如,现在没有一台计算机能像一个普
通的5岁孩子那样顺畅地谈论问题,更不用说这个孩子还会走路、捡起奇形怪状的物
体,以及看出别人是否开心、难过或生气。
所以,当我走在办公室附近的街道上(或者其他任何地方)时,会看到很多超
级思维。要想识别它们,我需要确认4个要素:第一,一群个体;第二,这些个体正
在采取某些行为;第三,这些行为之间存在的某种相互联系;第四,我们评估这些
行为时的参照目标。每当我看到这4个要素组合在一起时,我就能找到一个超级思维。不过有一点很
重要,那就是识别超级思维的过程有时很有用,有时则不然。比如,我可能会说办
公桌的4条腿构成了一个群体,共同防止桌面掉落到地上。就其本身而言,这句话并
没有错,而且从这个角度看,我的桌子就是一种极其简单的超级思维。但是,把超
级思维的概念以这种方式应用于我的桌子或许效用很小,因为我们并不能从中获得
一点儿有关如何使用桌子或做其他任何事情的新见解。
正如物理学家需要学习如何巧妙地运用像力、质量和能这样的概念,去有效地
认识真实的物理情景一样,我们也需要学习如何巧妙地运用超级思维和集体智能的
概念,去真正理解现实世界。
1. Kenneth J.Arrow and Gérard Debreu,“Existence of an Equilibrium for a Competitive
Economy,”Econometrica 22,no.3(1954):265-90,doi:10.23071907353.
2. The basic concept of supermind used here is a generalization of the concept
of“corporate entity”as defined by Benjamin Kuipers in“An Existing,Ecologically-
Successful Genus of Collectively Intelligent Artificial Creatures,”presented at the
Collective Intelligence Conference,MIT,Cambridge,MA,April
2012,https:arxiv.orgpdf1204.4116.pdf.
The detailed definition of a supermind is based on the definition of collective
intelligence in Thomas W.Malone and Michael S.Bernstein,Handbook of Collective
Intelligence(Cambridge,MA:MIT Press,2015),1-13.
Of course,this is not the only way to define collective intelligence,and many
authors have defined it in other ways.A sample of other definitions and a history of
how the term has been used previously is also included in Malone and
Bernstein,Handbook,10.
Starr Roxanne Hiltz and Murray Turoff,for example,define collective intelligence
as“a collective decision capability[that is]at least as good as or better than any
single member of the group.”See Hiltz and Turoff,The Network Nation:Human
Communication via Computer(Reading,MA:Addison-Wesley,1978).
John B.Smith defines it as“a group of human beings[carrying]out a task as if the
group,itself,were a coherent,intelligent organism working with one mind,rather than
a collection of independent agents.”See Smith,Collective Intelligence in Computer-
Based Collaboration(Hillsdale,NJ:Lawrence Erlbaum,1994).
Pierre Levy defines it as“a form of universally distributed
intelligence,constantly enhanced,coordinated in real time,and resulting in the
effective mobilization of skills.”See Levy,L’intelligence collective:Pour uneantbropologie du cyberspace(Paris:Editions La Decouverte,1994).Translated by Robert
Bononno as Collective Intelligence:Mankind’s Emerging World in
Cyberspace(Cambridge,MA:Perseus Books,1997).
And Douglas Engelbart defines the closely related term collective IQ as a
community’s“capability for dealing with complex,urgent problems.”See
Engelbart,“Augmenting Society’s Collective IQ,”presented at the Association of
Computing Machinery Conference on Hypertext and Hypermedia,Santa Cruz,CA,August
2004,doi:10.11451012807.1012809.
Each of these definitions provides useful insights,but as we’ll see,the broader
definition used here allows us to derive insights by comparing and contrasting very
different forms of collective intelligence.
3. We are taking here a pragmatic view in two different philosophical senses:the
pragmatic view of scientific theories and the philosophical tradition of
pragmatism.See Rasmus Gronfeldt Winther,“The Structure of Scientific Theories,”in
Stanford Encyclopedia of Philosophy(Winter 2016 edition),ed.Edward
N.Zalta(Stanford,CA:Stanford
University,2016),https:plato.stanford.eduarchiveswin2016entriesstructure-
scientific-theories; Christopher Hookway,“Pragmatism,”in The Stanford
Encyclopedia of
Philosophy,https:plato.stanford.eduarchivessum2016entriespragmatism.
In other words,we are saying that a scientific theory(such as our theory of
superminds) includes how the theory is interpreted in practice and whether these
interpretations are useful.
This means,from our point of view,that it doesn’t really make sense to ask
whether a supermind exists.What matters is whether a particular interpretation of
the world that includes that supermind is useful.One could similarly say that
theoretical concepts in physics(like force and energy) and in economics(like supply
and demand) exist only in the context of how they are interpreted by observers in
particular situations and how useful those interpretations are.
4. Encyclopedia Britannica,s.v.“intelligence”(cited by Shane Legg and Marcus
Hutter,“A Collection of Definitions of Intelligence,”technical report no.IDSIA-07-
07,IDSIA,Manno,Switzerland,2007,https:arxiv.orgpdf0706.3639.pdf);Howard
Gardner,Frames of Mind:Theory of Multiple Intelligences(New York:Basic Books,1983).
5. Linda S.Gottfredson,“Mainstream Science on Intelligence:An Editorial with 52
Signatories,History,and Bibliography,”Intelligence 24,no.1(1997):13-23.第2章
群体也能做智力测验吗?
或许自有人类以来,有些人看起来就要比其他人更聪明,他们能更迅速地解决
问题,知道的更多,学东西也更快。然而,在20世纪初,心理学家开发出一种旨在
客观衡量与我们所谓的智能类似的某种特质的方法,从而让我们对这种现象有了突
破性认识。
面对群体,我们可以采取同样的方法吗?我们能客观地衡量一个群体(或超级
思维)有多聪明吗?如果可以,那么我们能客观地说某些群体比其他群体更聪明
吗?有没有什么科学依据能帮助我们判断一个群体是否“智能”呢?根据我和我的
同事最近做的研究,我们现在已经知道上述所有问题的答案都是肯定的。但为了理
解其背后的原因,我们先要对个体智能及其测验方式有更多的了解。
测量个体智能
让智力测验成为可能的最关键进展,就是发现了一个有关人类能力的惊人事
实。假设你知道约翰擅长数学,而苏擅长阅读,那么你会怎样猜测他们另一科目的
表现呢?如果你和多数人一样,那么你可能会认为约翰的阅读水平是中等或中等偏
下,而苏的数学课业的表现亦如此。根据我们的日常经验,这样的推测似乎常常是
正确的。
然而,现在我们从数百项科学研究中了解到的惊人事实是:在通常情况下,擅
长某种脑力任务的人也擅长其他大多数脑力任务。 那些擅长阅读的人在数学方面
的表现往往也是中上等的,反之亦然。除了很多其他特点之外,那些擅长数学和阅
读的人的记忆力通常也很好,知道更多有关这个世界的常识,而且更善于逻辑推
理。 当然,不排除有些人会在某些领域比其他人更充分地提升自身技能,而有些
人则在通用智能(即完成各项不同的脑力任务的能力)方面比其他人更胜一筹。
一种更科学的表述方式是:如果你让很多人去执行很多项不同的脑力任务,并用统计学方法分析结果,就会发现他们在每项任务上的得分与他们在其他大多数任
务上的得分存在正相关关系。
有了这个数据集,你就可以利用一种叫作因子分析的统计方法,确定不同分数
相关性的基础结构。例如,如果你想通过这种方法来分析人们的政治态度,你可以
问他们关于很多问题(比如,堕胎、税收、同性恋婚姻和全民医疗保险等)的看
法。分析结果会告诉你,受访者给出的大多数答案是源于单一基础维度(比如,自
由派与保守派),还是多个维度(比如,关于社会和经济问题的看法)。
当心理学家用这种方法分析人们在不同脑力任务上的得分时,他们通常会发现
人们的各项任务表现是不同的,并且通过一个单一的统计因子就能预测出其中
30%~60%的差异。除此之外,没有一个因子的预测结果能超过上述范围的12。 这
种统计方法基于该因子为每个个体算出一个分数,得分高的人在大多数任务方面的
表现都比得分低的人好。这个统计因子与我们直觉上所谓的智能相对应,而且现代
的所有智力测验在设计时都会包含用于衡量这一因子的任务。
重要的是,我们必须意识到这个结果不是预先决定的。对于人的其他特征,比
如个性,并不存在能够预测其他表现的单一因子。例如,即使你知道一个人很内
向,也无法据此预测他是一个一丝不苟还是讨人喜欢的人。 但事实表明,不同的
人在完成脑力任务方面的通用智能水平存在差异,这是一个公认的科学事实。
当然,这个结果不仅在科学研究方面引人注目,也有显著的实用价值。通过任
何一项标准的智力测验,你都可以预测出一个人在很多其他任务方面的表现如何,而无须花几个月或几年的时间去逐一观察。例如,如果你想预测一个人的学习成
绩,或者他的各项工作表现,仅通过一个简短的纸笔智力测验的结果,你就能得出
相当准确的结论。 甚至从统计学上讲,更聪明的人寿命也更长。以某项客观的衡
量为基础对人生的这些重要结果进行预测,能产生很多非常重要的实用结论,其中
就包括价值数十亿美元的教育考试行业的发展,其用到的测试与智力测验十分相
似。
不过请务必记住一点:在预测一个人未来的一切时,这些智力测验远非灵丹妙
药。有很多其他的重要能力是无法通过标准的智力测验来测量的。例如,霍华德·加
德纳就将音乐能力、身体能力和人际交往能力归为不同种类的智能。 除了智能以
外,影响你的学校和生活表现的因素还有很多,包括(这里不一一列举)你的努力程度,你从家人和朋友那里得到的帮助,(当然)还有你的运气。
有些人已经对我们过度依赖标准智力测验和其他测试的现象提出了批评,这是
对的。美国学术能力评估测试(SAT)和其他类似的教育考试尽管不是被有意设计为
智力测验,但其结果却与那些智力测验的结果高度相关。不过,问题并不在于考试
没有价值,而在于我们有时会对它们期望过高。我们对考试预测作用的预期往往超
出了实际情况,而且过分强调考试对素质的衡量作用,致使我们对其他重要的方面
不够重视。
但是,我们也不应该忽略一个事实,那就是在预测人们是否擅长做我们认为重
要的事情时,智力测验通常是唯一的最佳方式。例如,在一项十分全面的研究中,智力测验对人们能否求职成功的预测是最准确的,其准确度甚至超过了实习经历、背景调查、面试表现和学业成绩。 所以,尽管智力测验并不是预测所有人生结果
的最佳方式,但个体智力测验的发展可以说是20世纪心理学领域的最重要成果之
一。
群体智力测验
那么,所有这些关于个体智能的结果对集体智能来说,又意味着什么呢?群体
能像个体一样智能吗?有没有什么能判断某些群体比其他群体更聪明的客观方法?
换句话说,对一个群体而言,有没有一个单一的统计因子就像个体智力测验那样,可以对群体在很多项不同任务上的表现进行预测?
就我和我的同事已知的情况而言,从未有人问过这个显而易见的问题,于是,我们决定寻找它的答案。我的同事安妮塔·伍利(Anita Woolley)在整项研究工作
中发挥了关键作用,并且是我们报告原始结果的那篇论文的第一作者。 克里斯托
弗·查布里斯(Christopher Chabris)等人也参与了其中的部分工作。
要想创造出一项针对群体的智力测验,我们需要做的第一件事就是挑选出一组
适合群体完成的任务。我们原本可以直接要求群体一起回答标准的个体智力测验的
相关问题,然而,其中虽然包含各种各样的脑力任务,但不一定有很多需要群体合
作才能完成的任务。所以,我们利用社会心理学家约瑟夫·麦格拉斯(Joseph
McGrath)为对团队任务进行分类而创立的一个著名的框架, 并从该框架的主要类别——提出、选择、协商和执行——中分别挑选任务。
例如,对于提出新想法的任务,我们要求各个小组就一块砖的用途开展头脑风
暴。对于在指定选项中进行选择的任务,我们要求各个小组解决来自一项名为“雷
文标准推理测验”的图形谜题。对于协商的任务,我们让小组成员假装他们都生活
在同一屋檐下,并规划一次购物之旅,相关限制因素包括出行时间、费用和他们需
要购买商品的易腐烂性。最后,对于执行的任务,我们要求他们把一个长文本段落
输入共享的在线文本编辑系统。我们还要求他们执行单词补全、空间谜题和估计问
题等任务。总的来说,这些任务代表了群体在现实生活中可能要完成的各项任务。
接下来,我们需要做的就是招募接受测验的小组。邀请在校大学生参与是比较
容易的,由于我们的研究是在麻省理工学院和卡内基–梅隆大学进行的,完全可以找
身边的大学生来帮忙。但我们认为,如果所有的测试对象都是高智商、成绩优异的
大学生,得到的测试结果或许会有偏差,对一项集体智能研究来说尤其如此。所
以,为了使参与测验的小组能代表社会的各个阶层,我们通过多种渠道(包括公共
网站)在多个城市的普通公众中招募测试对象。在对他们进行了简短的个体智力测
验后,我们发现他们的智力分布与美国人口的总体智商分布情况非常相似。
在我们最初的两项研究中,699位测试对象被分成192个小组,每个小组有2~5
个人。与企业和其他组织中的大多数团队不同,我们的小组中没有指定的领导者,选人也不以任何专长为依据。但不管在什么情况下,各个小组都要作为整体而非个
体去共同完成所给的任务。
这样的测验有用吗?
我们给了各个小组一次完成所有任务的机会,然后分析他们之间的相关性。在
我们的研究中,这是悬念最大的关键时刻。会不会像在个体智力测验中那样,存在
某个能解释群体的各项任务表现的单一因子呢?或者是否存在某个更复杂的因子结
构,例如,一些群体擅长数学任务,而另一些擅长文字任务?
答案是:群体就像个体一样。事实上,的确存在一个针对群体的单一统计因
子,而且它可以预测出这个群体在多项任务上的表现如何。我们在上文中已经提
到,针对个体的统计因子能预测出个体在不同任务上的表现的30%~60%的差异。在我们的研究中,对于群体,这个比例大致处于上述范围的中间,即45%。由于该因子
在个体智力测验中被称为智能,所以我们把与群体对应的新因子称为集体智能。
也就是说,我们发现群体和个体一样,具有某种形式的通用智能。这意味着我
们或许可以像利用个体智能那样,利用集体智能更多地了解是什么让群体有效完成
了各种各样的任务。
开启这个过程之前,我们针对最初研究进行了一次检验,目的是看看我们测量
的集体智能因子能否预测出群体在其他任务上的表现。为此,我们也给各个小组布
置了一些需要综合运用各种能力的更复杂的任务。例如,在一项研究中,小组和计
算机进行了一场跳棋比赛。在另一项研究中,他们用积木搭建了一系列符合规则要
求的结构。
我们发现,集体智能测试分数确实可以对群体在这些更复杂任务上的表现进行
显著有效的预测。事实上,在这些更复杂任务的表现预测方面,一个群体的集体智
能分数的效果比群体成员的个体智能分数的平均值或最大值都好。
什么能让群体变聪明?
在做研究之前,我们认为要寻找的与群体对应的单一集体智能因子,很可能要
通过群体成员的平均个体智能进行预测,也就是说,成员越聪明,群体就越聪明。
然而,我们的研究发现要有趣得多。
尽管我们的确找到了群体成员的平均及最大智能与群体的集体智能之间的相关
性,但它只是中等强度。换句话说,只是把一群聪明人聚集起来,并不能保证你会
拥有一个聪明的团队。或许你已经从自身经验中猜到这一点了,毕竟我们中的大多
数人都见过由聪明人组成的团队最后却一事无成的例子。但是,如果拥有一群聪明
人都不足以让该团队变聪明,什么才能做到这一点呢?
我们对前人研究中提到的有可能对团队有效性做出预测的多种因素进行了检
验,比如,成员对所在团队的满意程度,他们帮助团队取得优异表现的积极程度,以及他们在团队中的舒适感。结果发现,这些因素中没有一个与团队的集体智能水
平显著相关。不过,我们确实找到了三个显著因素。第一个是群体成员的平均社会洞察力。
我们运用“眼神读心”测试对这个因素进行测量,在测试过程中,人们通过看其他
人的眼睛照片,试着猜测照片中的人的心理状态(见下图)。 这个测试最初是用
来测量孤独症的(患有孤独症及相关病症的人的测试表现非常糟糕),但事实证
明,即使在“正常”的成人当中,不同的人在完成这项任务的能力上也存在显著的
差异。
你可能会说这个测试是对一个人的社会智能的测量,而且我们发现,如果这些
群体中有很多成员在这方面的表现突出,那么它们的集体智能水平通常要比其他群
体高。
我们发现的第二个重要因素是,群体成员能够大致平等地参与对话的程度。当
对话被一两个人主导时,平均而言,群体的智能水平要比参与度分布更均匀的时候
低。
最后,我们发现群体的集体智能与其女性成员的比例显著相关。女性占比更高
的群体也更聪明,这个结果基本上可以通过社会洞察力的测量并从统计学的角度来
解释。
在着手进行集体智能研究之前,我们就已经知道,女性的社会洞察力测试平均
分比男性要高。所以,关于我们的发现的一种可能的解释是,一个群体的集体智能
与其成员的社会洞察力有关,而非他们的性别。换句话说,如果一个群体中社会洞
察力强的人足够多,那么不管这些人是男是女,都足以让这个群体变聪明。但如果
你要挑选团队成员,而且只知道候选者的性别,而对其他情况一无所知,那么你在
女性身上发现社会洞察力的概率可能略高于男性。有趣的是,我们的研究结果与人们关于群体多样性的典型设想并不相符。大多
数人都会认为,男女比例差不多各占一半的群体应当是最聪明的。但在我们的数据
中,男女人数相等的小组位于智能水平最低的行列。如下图所示,我们的数据表明
群体的集体智能也许会随着女性比例的增加而不断提高。
还有一点很重要,就是意识到由于图中的点并不是线性分布的,所以在数据中
可能存在有相当数量的“噪声”(例如,从数据点延伸出去的垂直线表示的是统计
学家所谓的标准误差)。我们期待未来的研究能进一步阐明噪声背后的复杂原因。
不过,我们的研究结果至少已经给出了一些关于群体中男性与女性在集体智能上可
能起到的决定性作用的有趣看法。
社会智能是集体智能的关键因素在探究群体表现差异的过程中,我们从一个事实中获得了重要线索,那就是当
试图同时利用上述三个因素(即社会洞察力、发言机会的分配和女性成员比例)对
集体智能进行预测时,我们发现真正具有统计显著性的因素只有社会洞察力。这并
不意味着其他两个因素不重要,而只是表明在它们之下发挥作用的基本机制可能就
是社会洞察力。例如,我们在上文中提到,社会洞察力有可能产生了性别效应,而
且社会洞察力强的人或许更有可能得到发言机会。
后来,我们对在线小组进行的一项研究,充分证明了社会洞察力因素的强大力
量。在该研究中,我们随机地把测试对象分成两组。 面对面小组围坐在一张桌子
旁,一边相互交谈,一边在笔记本电脑上完成某个版本的集体智能测验。尽管在线
小组接受的是相同的测验,但他们完全看不到彼此,只能通过输入文字信息进行相
互交流。我们发现在这两个小组中,成员的社会洞察力对集体智能水平的预测效果
同样好。换句话说,善于从其他人的眼睛中读取情绪的人也善于团队合作,甚至是
在线沟通,而且根本看不到彼此眼睛的情况下!
这表明社会洞察力肯定与更广泛的人际交往能力相关,而且这些能力对在线交
流和面对面交流同样有效。例如,让你读懂他人脸上情绪的那种社会智能或许也能
帮助你根据他人输入的文字猜出他们的感受,并帮助你预测他们会对你可能回复的
各种内容做何反应。
也就是说,在面对面的世界里至关重要的社交能力和社会智能,在未来日益增
强的网络世界中同样重要甚至更重要。
认知多样性也很重要
在另一项研究中, 我们关注的是认知方式的多样性,即人们对世界的习惯性
看法的差异。根据前人对这个问题的研究,我们重点考虑三种不同认知风格的人:
言语型认知者、对象表象型认知者和空间表象型认知者。 言语型认知者善于用文
字进行推理,对象表象型认知者善于掌握图像(比如油画)的整体特征,空间表象
型认知者则善于对图像的各个部分逐一进行分析(就像对建筑蓝图那样)。大致来
说,这三种认知风格分别对应于人文、视觉艺术和工程学专业的学生。
当用这些认知风格的各种组合来分析群体的集体智能时,我们发现集体智能水平最高的群体拥有中等水平的认知多样性。换句话说,成员间认知风格差异很大的
群体,其智能水平并不高,这可能是因为他们彼此无法有效地交流。所有成员的认
知风格完全一致的群体,其智能水平也不高,这可能是因为他们不具备完成不同任
务所需的各项技能。最佳组合似乎是拥有中等水平多样性的群体,这可能是因为其
既有足以保证有效沟通的共性,又有足以解决一系列不同问题的多样性。
集体智能水平高的群体学习速度更快吗?
个体智能最重要的特征之一是,它不仅能预测人们可以做到的事情,还能预测
他们学习新事物的速度。集体智能也是这样吗?一个群体的集体智能水平可以预测
这个群体的学习速度吗?
回答这个问题的第一步是,我们在最初的研究中给一些完成了集体智能测验的
小组布置了另一项任务。我们要求他们玩一个被开发者称为“最小努力隐性协调博
弈”的游戏。 在这个游戏的每一轮,每位玩家都必须从5个数字中选择一个,他赢
得的点数取决于他自己选择的数字和其他小组成员选择的数字。为了帮助他们做出
选择,玩家每次都可以查看“支付矩阵”(见下表),根据他们自己选择的数字和
其他小组成员选择的最小数字,计算赢得的点数。
最小努力隐性协调博弈和著名的囚徒困境博弈有点儿像,都要求玩家同时且独
立地完成每一轮。他们不能把自己选择的数字告诉别人,唯一可能的协调方式就是
观察小组的其他成员在前几轮的选择。不过,与囚徒困境不同的是,这个游戏会让
合作的玩家而非竞争的玩家获得丰厚的回报。如果在全部10轮游戏当中,所有玩家
都做出了同样的选择(即数字40),那么他们每个人的收益都能实现最大化。但这
个选择是有风险的,因为如果你选择了40,而小组中的其他人选择了0,你就会失
分。如果你选择了除40以外的任何数字,那么不管其他小组成员如何选择,你都不
会失分。大多数小组在玩这个游戏的时候,前几轮的表现都不太好,但我们发现在全部
10轮游戏中,集体智能水平高的团队能更快地学会如何根据他们在前几轮的表现,暗中相互配合,他们的总分也因此显著高于其他团队。至少从这个角度看,正如我
们期望的那样,集体智能水平更高的群体,学习速度也更快。
集体智能还能预测什么?
在另外几项研究中,我们把集体智能测验题翻译成德语和日语,并对在美国、德国和日本以各自的母语接受测验的小组进行了研究。我们的发现进一步证实了我
们最初的结论,那就是在这三个国家的各种群体交流模式(面对面、语音、视频和
文本)中,都出现了与我们最初的研究相同种类的集体智能因素。
我们还发现,集体智能测验的分数能预测学生团队在某个课题项目上的表现,以及实验室团队在“假设你们迫降在沙漠中,请挑选出最重要的生存物品”这项任
务中的表现。
一个更加重要的问题可能是对于那些结果与现实世界密切相关的任务,集体智
能能否预测群体在其中的表现如何,而不只局限于实验室或者教室。作为解决这个
问题的第一步,我们在电子游戏世界里发现了一些非常有趣的结果。我们对全世界
最受欢迎的在线电子游戏之一——《英雄联盟》中的团队进行了研究。在这个游戏
中,玩家通常会5个人组成一个团队,相互协作去攻占对手团队的基地,杀死怪物,同时迎接沿途遇到的其他挑战。尽管这是一个虚拟的作战环境,但团队成员必须紧密合作,就像身处真实的战斗场景中一样。
这些团队中有很多都是由长时间在一起玩的玩家组成的,游戏会根据这些团队
的比赛表现给他们排名,类似于国际象棋选手排行榜。
在这款游戏的开发商拳头公司的配合下,有超过200个团队接受了我们的在线集
体智能测验。我们发现,正如我们期望的那样,团队的集体智能得分对他们在游戏
中的表现有着显著的预测作用,而且相当持久,不仅体现在他们接受测验的时候,还体现在6个月以后。 所以,就像个体智能可以预测个体在现实世界中的各种表现
一样,集体智能也可以对群体在现实世界中的表现做出预测。
测量集体智能
在继续下面的讨论之前,我们有必要暂停一下,对已经了解的情况进行回顾。
上述所有研究结果为以下结论奠定了坚实的基础:
1. 人类群体拥有一种集体智能,集体智能与通过个体智力测验来测量
的个体智能相似。
2. 这种集体智能就是我们在第1章中谈到的通用智能,即在多种不同
的任务中都有出色表现的能力。
3. 这种集体智能会受到下列因素的影响:
群体成员的个体智能;
群体成员与他人良好协作的能力(通过他们的社会洞察力来测量);
群体成员的认知多样性。
4. 我和我的同事为了测量这种集体智能而开发的测验,能够预测群体
在下列方面的表现:
执行实验室、课堂和在线游戏中的各项任务;? 利用面对面和在线沟通方式;
跨语言和文化交流。
这些结论引出了一些关于如何应用集体智能测验的有趣问题。我们能不能通过
让某个销售团队参与一次简短的测验(就像我们在研究中用到的那种),预测他们
在今后几个月内的工作表现呢?通过高层管理团队或者董事会的测验得分,可以预
测出他们在面对挑战时会有怎样的表现吗?尽管我们还不能确定这些问题的答案,但我们希望答案是肯定的。
另一个有可能被提出的有趣问题与提高某个群体的集体智能,并使之成为一个
智能水平更高的超级思维有关。我们知道个体智能在一个人年轻的时候就基本定型
了,但提升一个群体的智能水平似乎是大有可能的,比如通过替换足够多的成员。
在本书后面的章节中,我们还会看到其他提升群体智能水平的方法。
我们还能用什么方法测量集体智能?
虽然我和我的同事为了系统衡量一个群体的智能水平而设计的方法,带来了令
人满意的结果,但这种方法也有其局限性。比如,这项测验针对的是较小的群体。
在我写作本书的时候,我们正在利用某个版本的测验对多达40人的群体进行研究,而且我们很想知道这种方法至多能对多大规模的群体进行测试。不过我们认为,当
群体规模足够大的时候,就有必要使用其他一些方法了。
从更基本的层面上说,为了利用我们设计的测试方法,我们必须干预一个群
体,并让其成员做一件他们原本不会做的事情,即接受测试。对现实生活中的很多
群体(比如大型企业、市场)来说,要说服群体的每个成员花时间去完成一项哪怕
只需要几分钟的特殊测验,也非常困难。如果我们可以仅通过观察某个群体在一般
情况下的做事方法,并利用观察结果来准确估计群体的智能水平,就再好不过了。
幸运的是,不管是干预还是观察,都有很多种测量群体的集体智能的方法,而
且其原理都是我们在第1章提到的智能的两种定义中的一种。
你能通过观察了解很多东西有一种衡量群体专业智能的方法是选择一个目标,然后观察某个群体实现这一
目标的情况。比如,你可以用像利润、生产率和投资回报率这样的指标,衡量一家
企业的财务目标实现状况。或者你可以用过去5年内新产品的营收占比(产品创新度
的衡量标准)、创造的就业机会、员工对工作场所的满意程度,以及其他企业的高
管向它表示钦佩的频次等指标,来评估一家企业在其他方面的表现。
你可以通过像国内生产总值(GDP)这样的经济指标,或者像犯罪率、识字率和
生活质量概况这样的社会指标来衡量整个社会的表现。如果想衡量市场的表现,你
可以利用市场流动性、不稳定程度和根据新信息调整价格的速度等指标。
在某些情况下,你还可以通过观察对某个群体的集体通用智能进行了解。要做
到这一点,你需要在足够多的不同场合下观察群体的行为,从而评估群体的灵活性
或者适应性。
例如,尽管我们通常认为发明家托马斯·爱迪生是一位天才,但从某种重要的意
义上说,他参与创立的通用电气公司作为一个组织似乎更具有天才的特质。在1896
年入选道·琼斯工业平均指数的原始成分股中,通用电气是唯一一家至今 仍被留在
指数中的企业。 一个多世纪以来,为了在许多不同的行业和多种经济环境下生存
发展,通用电气必须具备极强的灵活性和适应性。当然,这也很可能得益于好运气
和其他因素,但我们完全有理由认为通用电气拥有高水平的集体通用智能。
近年来,苹果公司至少彻底改变了三大行业:个人计算机、音乐和移动电话。
很多人都会把苹果公司取得的大部分成就归功于一个人——史蒂夫·乔布斯,但从乔
布斯去世到现在,苹果公司仍在持续发展。公正地说,不管苹果公司在这些行业中
取得成功的原因是什么,我都认为它表现出卓越的集体通用智能。
经济学家已经发现,在通常情况下,公司的业绩大多会表现出惊人的持久性,也就是说,业绩表现好的公司往往能保持住成功,而业绩表现差的公司则往往只会
在底部徘徊。 例如,一项针对美国制造工厂的研究发现,在1972年生产率排行前
50名的工厂中,5年和10年后仍保持在前50名行列的工厂占比分别为61%和42%。而
在生产率垫底的工厂中,10年后仍保持在后50名的工厂占比为38%。 所有涉及管
理和经济的领域都在试图探索造成这些差异的原因,但业绩随时间推移表现出的这
种稳定性表明,在这些工厂中某种集体智能的水平是参差不齐的。
除了在很长一段时间内衡量同一个变量之外,我们还可以通过同时观察多个不同变量来评估通用智能。例如,不丹非常关注所谓的国民幸福指数,这是综合考虑
各种指标(健康状况、生活标准、教育水平和内心幸福感)后对社会福利水平的一
种衡量。如果一个社会在所有这些方面都做得很好,我们就可以说这个社会比只在
一两个方面表现突出的社会的集体通用智能水平更高。
有时你必须做些什么
要想通过干预的方式衡量群体的集体智能,你需要先选出群体表现的几个方
面,再利用测试看看群体对你的行为做出的反应。在面对大型群体的时候,这种方
式往往很难实现,因为你要么需要说服群体的每个成员参与其中,要么需要足够的
资源去改变群体环境。
如果你有充足的资源,就可以通过将某个组织置于各种各样的情境中,对这个
组织的环境进行干预,比如,你可以建立一个与研究对象呈竞争之势的组织,或者
对研究对象需要的某些原材料开出非常优惠的价格。通过观察该组织在应对这些极
端情况时的表现,你肯定能了解到有关其智能水平的一些有趣信息。不过,像这样
的大规模实验当然是有限制条件的。
事实上,小规模干预也是有用的。例如,很多公司利用“神秘顾客”对在零售
商店、餐馆和电话客服中心直接面向公众的员工表现进行评估。神秘顾客会和其他
顾客一样,使用某个组织的服务,比如吃一个汉堡包、买衣服或者拨打电话求助热
线。被组织评估的员工会以为神秘顾客就是普通顾客,所以很可能像对待其他任何
顾客一样对待神秘顾客。不过,与普通顾客不同的是,这些神秘顾客会仔细留意并
报告他们接受服务的具体情况,并为此获得报酬。
当评估一个组织在实现目标(比如,及时问候和礼貌地服务顾客)方面的专业
智能时,神秘顾客通常是一种好办法。如果与神秘顾客的互动过程要求员工完成很
多不同种类的任务,这就有可能成为衡量该组织的集体通用智能的部分方法。
例如,你可以招募形形色色的神秘顾客,无论男女老少、是否受过良好的教
育、暴躁易怒还是彬彬有礼,并让他们拨打智能手机供应商的客服热线,咨询各种
各样的问题,比如硬件故障、软件故障和不了解产品等。如果有些公司的表现始终
很好,那么你可以说它们的客服业务表现出很高的集体智能水平;如果有些公司的
表现很差,那么你可以说它们欠缺集体智能。关于这些结果的统计分析能否帮我们找到一个单一因子,当群体面对所有类型
的问题时,该因子能对群体表现的巨大差异做出预测(类似于我们在小型工作团队
中的发现),这将是一个有趣的问题。即使真的找到了,我也不会对此感到惊讶。
所以,这一切意味着什么呢?我们现在知道,将智能的概念应用于群体并不只
是一种诗性隐喻。对于通用智能——在实现各种不同目标方面的良好表现——我们
已经看到,在统计学上,群体和个体都表现出智能的特质。专业智能——在完成某
个特定目标方面的良好表现——则提供了一种有效方法,可用于对很多不同团队在
实现单一目标方面的表现进行比较。
我们还获得了关于“是什么让某些群体比其他群体更聪明”这个问题的一些振
奋人心的线索,那就是只拥有聪明的个体是不够的。个体还需要进行有效合作。
1. The first person to document this was Charles Spearman,and it is arguably one of
the most replicated results in all of psychology.See Spearman,“‘General
Intelligence,’Objectively Determined and Measured,”American Journal of Psychology
15(1904):201-93.
2. Ian J.Deary,Looking Down on Human Intelligence:From Psychometrics to the
Brain(New York:Oxford University Press,2000).
3. Christopher Chabris,“Cognitive and Neurobiological Mechanisms of the Law of
General Intelligence,”in Integrating the Mind:Domain General Versus Domain Specific
Processes in Higher Cognition,ed.Maxwell J.Roberts(Hove,UK:Psychology
Press,2007),449-91;Earl Hunt,Human Intelligence(Cambridge,UK:Cambridge University
Press,2011),91ff.;Gilles E.Gignac,“The WAIS-III as a Nested Factors Model:A Useful
Alternative to the More Conventional Oblique and Higher-Order Mo dels,”Journal of
Individual Differences 27,no.2(2006):73-86.
4. Robert R.McCrae and Paul T.Costa,“Validation of the Five-Factor Model of
Personality Across Instruments and Observers,”Journal of Personality and Social
Psychology 52,no.1(1987):81-90;John M.Digman,“Personality Structure:Emergence of
the Five-Factor Model,”in Annual Review of Psychology 41,ed.Mark R.Rosenzweig and
Lyman W.Porter(Palo Alto,CA:Annual Reviews,Inc.,1990):417-40.
Some researchers have proposed that there may be a“general factor”for
personality,as there is for intelligence(e.g.,Janek Musek,“A General Factor of
Personality:Evidence for the Big One in the Five-Factor Model,”Journal of Research
in Personality 41,no.6 [2007]:1,213-33),but there is not yet a consensus in the
field that this is true.If there comes to be a general consensus that there is a
general personality factor,the point made in the main text is still valid:it’scertainly not preordained that there would be a general factor,either for
intelligence or for personality.
5. Deary,Looking Down on Human Intelligence,22-23.
6. Howard Gardner,Frames of Mind:Theory of Multiple Intelligences(New York:Basic
Books,1983);Howard Gardner,Multiple Intelligences:New Horizons(New York:Basic
Books,2006).
7. John E.Hunter and Ronda F.Hunter,“Validity and Utility of Alternative Predictors
of Job Performance,”Psychological Bulletin 96(1984):72-98.
8. Anita Williams Woolley,Christopher F.Chabris,Alex Pentland,Nada Hashmi,and
Thomas W.Malone,“Evidence for a Collective Intelligence Factor in the Performance
of Human Groups,”Science 330,no.6,004(October 29,2010):686-
88,http:science.sciencemag.orgcontent3306004686,doi:10.1126science.1193147.
9. Joseph Edward McGrath,Groups:Interaction and Performance(Englewood
Cliffs,NJ:Prentice Hall,1984).
10. Simon Baron-Cohen,Sally Wheelwright,Jacqueline J.Hill,Yogini Raste,and Ian
Plumb,“The ‘Reading the Mind in the Eyes’Test Revised Version:A Study with Normal
Adults,and Adults with Asperger Syndrome or High-Functioning Autism,”Journal of
Child Psychology and Psychiatry 42,no.2(2001):241-
51,doi:10.1017S0021963001006643;Simon Baron-Cohen,Therese Jolliffe,Catherine
Mortimore,and Mary Robertson,“Another Advanced Test of Theory of Mind:Evidence from
Very High Functioning Adults with Autism or Asperger Syndrome,”Journal of Child
Psychology and Psychiatry 38,no.7(1997):813-22.Figure reproduced with author’s
permission.
11. An adapted version of this figure was published in Anita Williams Woolley and
Thomas W.Malone,“Defend Your Research:What Makes a Team Smarter?More
Women,”Harvard Business Review 89,no.6(June 2011):32-33.
The collective intelligence scores are normalized with 0 as the average across
all scores.
12. David Engel,Anita Williams Woolley,Lisa X.Jing,Christopher F.Chabris,and Thomas
W.Malone,“Reading the Mind in the Eyes or Reading Between the Lines? Theory of Mind
Predicts Effective Collaboration Equally Well Online and Face-to-Face,”PLOS One
9,no.12(2014),http:www.plosone.org articleinfo% 3Adoi%2F10.1371%2Fjournal.p
one.0115212,doi:10.1371journal .pone.0115212.
13. Ishani Aggarwal,Anita Williams Woolley,Christopher F.Chabris,and Thomas
W.Malone,“Cognitive Diversity,Collective Intelligence and Learning in
Teams,”presented at the 2015 European Academy of Management
Conference,Warsaw,Poland,June 17-20,2015.14. Maria Kozhevnikov,“Cognitive Styles in the Context of Modern Psychology:Toward
an Integrated Framework,”Psychological Bulletin 133(2007):464-81.
15. Aggarwal,“Cognitive Diversity”;John B.Van Huyck,Raymond C.Battalio,and Richard
O.Beil,“Tacit Coordination Games,Strategic Uncertainty,and Coordination
Failure,”The American Economic Review 80,no.1(1990):234-48;Cary Deck and Nikos
Nikiforakis,“Perfect and Imperfect Real-Time Monitoring in a Minimum-Effort
Game,”Experimental Economics 15,no.1(2012):71-88.
16. Figure from Aggarwal,“Cognitive Diversity,”2015.Reprinted by permission of
authors.
17. David Engel,Anita Williams Woolley,Ishani Aggarwal,Christopher F.
Chabris,Masamichi Takahashi,Keiichi Nemoto,Carolin Kaiser,Young Ji Kim,and
Thomas W.Malone,“Collective Intelligence in Computer-Mediated Collaboration Emerges
in Different Contexts and Cultures,”Proceedings of the SIGCHI Conference on Human
Factors in Computing Systems(New York:Association for Computing
Machinery,2015),doi:10.11452702123.2702259(conference held in Seoul,South
Korea,April 18-23,2015).
18. Young Ji Kim,David Engel,Anita Williams Woolley,Jeffery Yu-Ting Lin,Naomi
McArthur,and Thomas W.Malone,“What Makes a Strong Team?Using Collective
Intelligence to Predict Team Performance in League of Legends,”Proceedings of the
ACM Conference on Computer-Supported Cooperative Work and Social Computing(New
York:Association for Computing
Machinery,2017),http:dx.doi.org10.11452998181.2998185(conference held in
Portland,OR,February 25-March 1,2017).
19. 截至作者写作本书的时间。而自2018年6月26日起,通用电气已被踢出道·琼斯工业平均指数。
20. Steve Schaefer,“The First 12 Dow Components:Where Are They Now?”Forbes,July
15,2011,http:www.forbes.comsitessteveschaefer20110715the-first-12-dow-
components-where-are-they-now.
21. Martin Baily,Charles Hulten,and David Campbell,“Productivity Dynamics in
Manufacturing Plants,”Brookings Papers on Economic
Activity:Microeconomics(1992):187-267,doi:10.23072534764;Eric Bartelsman and
Phoebus Dhrymes,“Productivity Dynamics:U.S.Manufacturing Plants,1972-1986,”Journal
of Productivity Analysis 9,no.1(1998):5-34,doi:10.1023A:101838362;Eric Bartelsman
and Mark Doms,“Understanding Productivity:Lessons from Longitudinal
Microdata,”Journal of Economic Literature 38,no.3(2000):569-
94,doi:10.1257jel.38.3.569.
22. Baily et al.,“Productivity Dynamics,”187-267.
The statistics reported here count plants weighted by their employmentnumbers.The more workers plants employed,the more heavily they were weighted.第二部分
计算机如何能让超级思维更聪明?第3章
人类将如何与计算机一起工作?
许多人认为计算机科学的未来就是人工智能。那么,根据你给人工智能下的定
义,谷歌公司的在线搜索引擎几乎肯定是当今世界上人工智能得到最广泛应用的案
例了。全世界每秒钟有超过230万人往谷歌搜索栏中输入关键词,然后看到与这次搜
索相关的网页列表。事实上,世界上每7个人中有不止一个人使用谷歌搜索引擎的频
率达到每月一次,他们平均每天使用三次谷歌搜索引擎。
但是,谷歌搜索引擎并不像《星球大战》中的机器人R2–D2、C–3PO和终结者,或者我们在科幻小说中看到的其他大多数人工智能机器人。相反,? 与其说它是同伴,不如说它是一种工具或者一位助手;
它的外形和行为都不像人类;
它通常不通过对话式语句与人类交流。
我认为,在未来几十年甚至更长的时间里,人们使用计算机的最主要方式可能
更像谷歌,而不是畅销小说中的虚构机器人。在这一章中,我们将会看到为什么每
一种大众印象都有可能是错误的,以及未来更有可能是什么样子的。
相较于人类,计算机将会扮演什么角色?
关于计算机在这个世界上的真实用途,首先要注意的一点是,人类总以某种方
式参与其中。即使计算机可以从头到尾独立完成一项任务,人们也总要先进行软件
开发,随着时间推移通常还要对其进行修改。人类要决定在不同情况下使用不同程
序的时机,以及当出现问题时应该做什么。而且,在很多情况下,对于机器无法完
成的那部分工作,人类自始至终都要参与其中。在探讨人类与计算机将如何一起工作的问题时,一种有效的方法是思考相较于
人类,计算机可以扮演什么角色。当机器仅扮演工具的角色时,人类拥有的控制权
是最大的,而随着机器的角色扩展为助手、同伴和最终的管理者,它的控制权也越
来越大。
工具
像锤子或者割草机这样的实物工具,尽管能做一些人类个体做不到的事情,但
作为使用者,人类每次都要对实物工具进行直接控制,引导它们的行动并监控其进
度。信息工具亦如此,当你使用字词处理器、电子表格或者在线日历时,机器做的
都是你让它做的事情(即使这并不总是你真正想让它做的事情)。
在许多情况下,自动化工具可以大幅提高人类使用者的专业智能。例如,一位
使用电子表格的财务分析师会比试图做心算的人更快、更准确地完成更多计算,使
用计算机辅助设计工具的建筑师会比只用纸笔的人更快更准确地对设计进行创作、修改和测量。
然而,未来自动化工具的很多最重要的用途将不是增加个人用户的专业智能,而是通过帮助人类更有效地相互沟通来提高团队的集体智能。事实上,我们在第1章
中已经看到,目前计算机的最主要用途都是帮助人类相互交流:电子邮件、文字处
理、短信,以及大部分网络或者手机应用程序,比如维基百科、脸书、推特和
YouTube视频等。在所有这些情况下,计算机并没有做多少“智能化”的处理,主
要是将人类创建的信息传递出去。
我认为,如果你观察一下我们现在使用计算机的实际方式,就会发现这一点显
而易见,但大多数人仍然认为计算机主要是用于计算的机器。这有可能是因为计算
机最初的用途确实是计算;这也有可能只是出于词源学方面的原因,毕
竟“computer”(计算机)是由动词“compute”(计算)派生而来的;这还有可
能是因为我们长期以来都把计算机视为“电脑”。
不管导致这种错误认知的原因是什么,有一点很清楚,那就是到目前为止计算
机主要用于帮助人类沟通。而且我认为,计算机的这种使用方式短期内不会发生改
变。至少在未来10年、20年甚至更长的时间内,计算机最常见的用途仍然是帮助人
类相互交流的精密工具。助手
与工具不同的是,人类助手可以在无须你直接关注的情况下工作,并且通常会
在试图实现你设定的总体目标方面表现得更积极主动。尽管自动化助手的表现与之
类似,但工具和助手之间的界限并不总是那么清晰。例如,尽管短信平台通常属于
工具范畴,但它们有时会在你没有提出要求的情况下自动纠正拼写(偶尔还会给出
令人捧腹的结果 )。
谷歌搜索引擎也是一种工具:在你输入关键词后,它会显示出包含这些关键词
的网站。不过,为了瞬时完成这项工作,谷歌的算法一直在后台运行着,不断更新
基本上囊括所有网页的庞大索引。而且,谷歌的搜索算法会在搜索结果的显示顺序
上行使相当大的决定权。由于它们在完成所有这些任务时并未得到你的任何关注,所以它们实际上是工具和助手的某种结合体。
随着机器控制权的不断增大,以谷歌智能助理和亚马逊语音助手Alexa为代表的
自动化系统致力于成为用户的助手,而不只是工具,特别是当它们做一些像主动向
你提供你未查询的信息这样的事情时,比如为了让你赶上飞机,提醒你必须现在出
发去机场。同样地,全自动驾驶汽车显然也将成为助手,它会类似出租车的人类驾
驶员一样,自主导航穿过车流,把你送到指定目的地。
自动化助手的另一个案例是在线服装零售商Stitch Fix公司使用的软件,它能
帮助人类时装设计师向顾客推荐产品。 Stitch Fix公司的顾客先要填写有关他们
的穿衣风格、尺码和价格偏好的详细问卷,然后,所有这些信息都会被机器学习算
法消化掉,并据此挑选出有可能让顾客中意的服装产品,供时装设计师考虑。不
过,最终决定将每批衣服中的哪5件寄送给顾客的是时装设计师。顾客只需为他们想
要的产品付款,并将其他产品退回。
在这种合作关系中的算法助手,能比人类时装设计师考虑到更多的信息。例
如,尽管大多数人都觉得通常很难买到时尚又合身的牛仔裤,但裤管内缝的长度其
实是一个判断牛仔裤是否合身的良好指标,而且算法能为每位顾客挑选出与他的裤
子内缝长度相同的其他顾客决定购买的各种牛仔裤。
然而,人类时装设计师也能考虑到机器考虑不到的信息,比如,顾客想要的是
参加准妈妈派对的服装,还是出席商务会议的服装。当然,与机器相比,人类时装
设计师能以更个性化的方式满足人类顾客的需要。因此,人类与计算机的组合能够提供比其中任何一方更好的服务。
在另一个迥然不同的行业中,由IBM(国际商业机器公司)与克利夫兰医学中心
合作开发的WatsonPaths软件也是一种自动化助手。它与击败智力竞赛类电视节
目《危险边缘》的人类冠军的超级电脑“沃森”(Watson),都构建在同样的基础
技术之上。WatsonPaths利用它从医学文献中收集到的知识,给出符合患者症状和
病史的多种可能的诊断。
然后,和Stitch Fix软件一样,Watson Paths会向医生展示多种合理的诊断
和它利用的推理链,以及这些不同诊断的置信度。尽管人类医生对如何治疗患者拥
有最终决策权,但自动化医疗助手能帮助他们考虑海量的医学文献,并提出他们可
能从未考虑过的诊断。
同伴
计算机最有趣的一些用途与它扮演的某种角色有关,那就是它作为人类的同
伴,而不是助手或工具,即使是在并未用到太多真实的人工智能的情况下。
这在很多情况下都会发生,因为一个程序对一个人来说是助手,对另一个人来
说则是同伴。例如,如果你乘坐一辆自动驾驶汽车出行,我也驾车行驶在同一条路
上,你的驾驶助手就是我的驾驶同伴。如果你是一名股票交易员,那么你可能会在
不知情的情况下,与别人的自动交易系统进行交易。如果你正在易贝(eBay)拍卖
网站上竞价,那么你的竞争对手可能会利用自动秒杀软件,在拍卖结束前的最后几
秒钟开出高于你的价格。
有时,自动化同伴并不会代表某个人的利益,而旨在提升整个团队的利益。例
如,你的工作是为Lemonade保险公司处理理赔业务,而且你有一个名为“AI吉
姆”的自动化同伴。 AI吉姆是一个在线“机器人”,当客户提出理赔申请时,会
通过与AI吉姆互发文本信息的方式完成。如果他们的理赔申请符合某些参数,机器
人几乎马上就会自动支付理赔款。否则,这项理赔申请就会被提交给某位职员,后
者会做所需的任何额外处理工作。
维基百科也有许多能自动进行某些编辑,并把其他可能需要编辑的部分告知人
类的机器人。 例如,一个机器人会利用机器学习算法自动撤销对文章进行的那些
很可能只是故意破坏的修改(比如添加污言秽语);而另一个机器人则会自动检查新页面,看它们是否包含了大量出现在网络上其他地方的文本。如果确实如此,机
器人就会将其标记为需要人类注意的潜在侵权问题。
换句话说,维基百科的人类编辑和机器人就像同事一样,都在编辑相同的文
章。由于机器人全部是由人类管理的,所以在某种意义上,它们只是其人类主人的
助手。但如果你是一个试图损害维基百科网页的人类破坏者,撤销恶意更改的机器
人执行的任务就和其人类同伴的任务完全相同。而且,这对维基百科内容的总体效
果几乎肯定比没有计算机作为人类同伴的情况要好。
管理者
人类管理者会委派任务、提供指导、评估工作,并协调其他人的行动。机器也
能做到这些事情,而且当它们这样做的时候,就会成为自动化的管理人员。尽管有
些人觉得让机器来做管理者的这一想法风险很大,但我们每天都在和这样的机器打
交道。例如,交通信号灯替代了人类警察,在十字路口起到指挥交通的作用。再例
如,电话呼叫中心的机器会自动为客服人员转接电话,而这原本是一项由人类管理
者负责的任务。不过,大多数人都不认为这两种情况会导致什么风险或者问题。
我认为,将来机器扮演管理者角色的情况可能会更多。例如,由我的朋友阿尼
基特·基图尔(Aniket Kittur)、罗伯特·克劳特(Robert Kraut)及他们在卡内
基–梅隆大学的同事开发的CrowdForge众包工作流系统,可用于组织在线工作者撰
写像百科全书文章一样的文档。 我们把这些在线工作者称为“土耳其
人”(Turkers),因为他们都是通过亚马逊公司的一个名为“土耳其机器
人”(Mechanical Turk)的服务平台招募来的,我们稍后会详细介绍这个网站。
一开始,CrowdForge系统会要求“土耳其人”为某篇文档(比如,一篇关于纽
约市的百科全书文章)拟定一个大纲,它可能会包括风景名胜和简史等(见下
图)。 然后,针对大纲中的每个部分,系统会要求其他“土耳其人”找到可能与
该部分相关的资料。接下来,系统会收集与各个部分相关的资料,并把它们发送给
另外一些“土耳其人”,他们将根据收到的资料为这一部分写一个段落。最后,系
统会把所有段落放在一起,形成一篇完整的百科全书文章。以这种方式创作的文
章,平均每篇需要有36个不同的人完成36项独立的子任务,而且成本只有3.26美
元。当研究人员让其他“土耳其人”评价这些文章时,他们都认为这些文章比一个
人花同样多的钱写出来的类似文章要好得多,而且它们的质量与简明英语版维基百
科中的文章大致相当。
换句话说,在这个过程中,研究人员为自己创造了一位自动化助手。这位助手
通过将任务委派给一个“土耳其人”团队,并协调任务之间的相互关系来帮助研究
人员管理这些在线工作者。尽管对“土耳其人”来说,这与完成人类管理者委派给他们的任务并无不同,但自动化系统可以让这个过程覆盖庞大的撰稿人群体。
我认为,这种可称为“产业化写作”的形式未来会变得更普遍。例如,在当今
世界,我们使用的几乎所有家具和服装都是在工厂里生产出来的,而且在每件产品
的生产过程中,都有很多人(通常还有很多机器)参与其中。虽然我们偶尔也会买
一些像毛衣或椅子这样的手工制品,但这些肯定是例外,而不是常规。同样地,我
猜测在不远的将来,我们看到的许多书面材料可能都是在像CrowdForge系统这样的
产业化写作过程中产生的。而且,在后面的章节中我们将会看到,越来越多的实际
写作任务可能都是由机器而不是人完成的。尽管我们并非再也看不到某个人写作的
长篇文本了,但它们总有一天可能会变得像今天的手工编织毛衣一样稀有。
人工智能机器看起来像什么?
哲学家马歇尔·麦克卢汉(Marshall McLuhan)指出,我们对新技术最初的认
识通常都来自与旧技术的对比。 例如,最早的汽车被称为无马马车,其外观也与
这个名称相符。它们看起来就像传统的马车一样,有包括踏脚板在内的所有部分,除了前面没有马。当然,随着时间的推移,新技术独特的必备条件和可能性也在汽
车设计中得到了体现。例如,由于汽车的行驶速度比马车快得多,所以它们就有了
光滑的流线型外观和将乘客车厢密封起来的车窗。
同样地,许多人想象人工智能机器的外观和行为会或多或少地类似于人类。除
了少数像R2–D2一样可爱的机器人外,大多数的虚构机器人都有两条胳膊、两条腿,以及一张长着一双眼睛、一个鼻子和一张嘴的脸。不过,在我们今天使用的真实人
工智能产品跟科幻小说中的机器人几乎完全不一样。谷歌搜索引擎、亚马逊语音助
手Alexa,以及银行使用的几百种信用审批算法看起来什么也不像。对与它们互动的
人类来说,它们只是存在于网络空间或者“云”的模糊世界中的无实体智能。
即使是做体力工作的机器人,通常看起来也不像可能从事过这类工作的人类。
例如,在亚马逊公司的仓库里搬运货物的机器人看起来就和搬箱子的人类不一样。
这些机器人是一些大约8英寸 高的橙色小盒子,面积约一平方英尺 ,底部有几
乎完全隐藏起来的小轮子。它们会在仓库里转来转去,钻到一个货架单位下方,把
它(以及上面的所有东西)抬起来,并搬到另一个地方。谷歌公司最新的无人驾驶汽车看起来也不像由机器人驾驶的传统汽车,而是彻
底移除了方向盘、制动踏板和加速器。所有的人工智能连同发动机和汽车的其他机
械零件一起,都被隐藏在乘客看不到的地方。
当你阅读这些文字的时候,我刚才举的例子可能听起来已经过时了,但我认为
我们未来使用的大多数人工智能产品,很可能会演变成与目标任务的实际要求相匹
配的独特形式,而非拥有与科幻小说中的机器人一样的类人形态。形式各异的人工
智能将以不同的方式嵌入不同的社会过程。
例如,用于生产和交付实体产品的供应链将包括各种负责制造、组装和运输实
物的机器,但其中每台机器都将拥有与其用途相匹配的独特外形。负责控制它们的
智能有时在机器内部,有时则在地球的另一边。在你生病时负责诊疗的机器,让你
的家保持清洁舒适的机器,以及为所有这类活动提供能量的机器,全都是如此。
什么时候我们会需要类人机器人?
在对这种几乎看不见的智能做一般性预测时,要考虑到两种重要的例外情况。
第一,一些体力工作需要在为人类设计的物理环境中完成,为了在人类环境中自如
行动,机器人可能就需要有类人外形。例如,如果你想让一个机器人为你做饭、整
理床铺,并且帮你搬运家里的其他东西,你就需要它能穿过你家的门道和爬楼梯。
这样的机器人可能看起来很像人类。
第二,我们可以仅为了满足人类与类人生物交流的愿望而创造出看起来像人类
的机器人。例如,Baxter智能协作机器人是美国的一家机器人公司Rethink
Robotics制造的一款工业机器人,其设计目的是在工厂中完成工人目前所做的体力
工作。Baxter有像人类一样的双臂,在它两臂间的躯体上部,也就是相当于人类头
部的位置,还有一张类似人类的脸,这可能并非偶然。尽管这里需要有一张脸或一
个头不是出于技术原因,但Baxter的设计师可能认为,如果工厂里的工人与看起来
像人类的机器人一起工作,会感觉更舒服。
如果人工智能的未来与其他信息技术的历史有相似之处,那么我们几乎可以肯
定的是,它也会被用于色情目的。CD(光盘)、DVD(数字光盘)和互联网的一些早
期用途就与色情作品有关,而且将来似乎很有可能出现基于人工智能的性爱机器
人。我们如何与计算机交流?
在几十万年的生物与文化进化历程中,人类已经开发出多种相互交流的方式。
其中最重要的方式可能是,利用英语、汉语或斯瓦希里语等语言中的词汇进行交
谈。而且,发明这些语言的书面版本的重要性,怎么强调都不为过。不过,人类也
会用其他许多方式进行交流,比如面部表情和手势,相互触摸,给彼此唱歌或者进
行艺术创作。
因为许多年来人类一直在利用所有这些交流方式,所以我们早已对它们习以为
常,自然而然地,我们也想以同样的方式与机器进行交流。例如,亚马逊公司的智
能语音助理Alexa和苹果公司的智能语音助理Siri等系统已经能够有限地使用英语
等人类的日常语言,而且随着时间的推移,机器使用人类语言与我们交流的能力会
越来越强。这意味着将会有更多的计算机系统利用语音或文本与我们就特定任务进
行沟通。但我们将在下一章中看到,要想让机器像人类一样全面灵活地使用和理解
人类的日常语言,可能还需要数十年艰难的技术攻关。
即使能在技术上实现这一目标,我们也不会总想用与他人沟通的那些方式来与
机器交流,这背后有一个非常重要的原因:至少就某些目的而言,机器的交流能力
远远优于人类。其中最突出能力就是机器可以立即生成极其丰富的视觉图像,而人
类仅靠自身永远无法做到这一点。
例如,如果一个没有其他工具的人要为想去城市另一边的一家商店的你指路,他最多只能给你一连串包含地标和转向的口头指引。但即便是今天的计算机也可以
比这个人做得更好,因为它们会立即为你提供一张显示出完整路线的详细的可视化
地图。
想象一下,如果你想编辑一封信,而且要通过电话告诉某个人需要做哪些修
改。那么,你不得不说出这样的话:“找到第二段的第三句,把‘苏珊’一词替换
成‘约翰玛丽’,然后在这两个名字中间加上‘和’字。”想想看,如果你能像今
天使用计算机那样定位、点击鼠标和打字,这件事做起来该有多么容易。
我在麻省理工学院媒体实验室的同事石井裕(Hiroshi Ishii)利用“可触比
特”(tangible bits)和“自由基原子”(radical atoms)的概念,将这种与
计算机进行非语言交互的想法进行了深入扩展。许多年前,我曾和石井裕合作开展了一个研究项目。在这个项目中,我们让人们通过在一张特殊的桌子上移动小物
体,对公司供应链的不同布局做实验,这张桌子能够感知物体的位置。 例如,有
些物体代表工厂,有些物体代表仓库。通过移动和旋转这些物体,人们能看到,如
果他们移除一间仓库或者增加一间工厂的生产量,供应链的产能和订货交付时间会
发生什么变化。换句话说,人们不是通过语言告诉计算机他们想要评估的布局,而
是通过直接操控实体对象来实现。
最近,石井裕和他的同事一直在对更加前沿的人机交互方式进行实验。在这些
实验中,他们使用了人与计算机都能操控的三维材料。例如,在一个名为
SoundFORMS的研究项目中,用户能够利用一个可变形的显示组件来作曲,而且该组
件能够展现出作曲过程中的声波(见下图)。用户可以用手触摸显示组件,并改变
声波的实际形状。
或者我们想想工业机器人Baxter。目前,大多数的机器人在处理新任务前,都
需要进行非常详细的程序设计,但你只要按照自己想要的方式去移动Baxter的手
臂,就能安排它做一些新事情。
从长远来看,人类与机器交互的终极方式可能将会是一种心灵上的融合,也就
是机器与人类大脑中不同神经元之间的直接神经连接。当然,我们在短期内无法做
到这一点,不过一些早期实验的结果表明其前景光明。例如,最近由加州理工学院
的理查德·安德森(Richard Andersen)领导的一个研究团队,将一只机械臂与被
植入一名男性大脑中的硅片连接起来,这名男性13年来一直处于颈部以下瘫痪的状态。 经过练习,他只需要通过思考它就能移动机械臂,除了做其他事情以外,他
还成功地自己举杯喝了瓶啤酒。
尽管我们并不确定这项技术会以多快的速度发展,但我的态度非常乐观,甚至
还和朋友开玩笑说我想成为第一位接受神经植入的90岁老人。按照目前的发展速
度,在我们拥有像人类一样能充分使用和理解人类日常语言(比如英语)的机器之
前,很有可能先实现功能强大的神经接口。
我们在上一章中看到,一个人类团队要想变聪明,其成员必须善于合作。同样
地,当人类团队中加入计算机时,也需要人与计算机能良好地相互合作。尽管有时
最好的方法是让人类学会如何更好地与计算机合作,但在大多数情况下,最好的方
法应该是设计出能与人类有效协作的计算机。我们在这一章中已经看到,在实现这
一目标的过程中,有很多前景光明的可能性。当我们考虑这些可能性时,会遇到一
个关键问题:计算机未来的智能水平——尤其是通用智能水平——将会如何?
1. The Google statistics are from Craig Smith,“270 Amazing Google Statistics and
Facts(August 2017),”DMR,modified August
13,2017,http:expandedramblings.comindex.phpby-the-numbers-a-gigantic-list-of-
google-stats-and-facts.
If there are 1.17 billion monthly unique searchers and a world population of
about 7.4 billion(see United States Census Bureau,“U.S.and World Population
Clock,”accessed September 21,2017,https:www.census.govpopclock),this means that
about one in seven people in the world do a search each month.One hundred billion
searches per month means about three per user per day.
2. See http:damnyouautocorrect.com.
3. H.James Wilson,Paul Daugherty,and Prashant Shukla,“How One Clothing Company
Blends AI and Human Expertise,”Harvard Business Review,November
21,2016,https:hbr.org201611how-one-clothing-company-blends-ai-and-human-
expertise.
4. “WatsonPaths,”IBM,accessed August 17,2016,https:www.research.ibm
.comcognitive-computingwatsonwatsonpaths.shtml?
cmp=usbrbcm=scsr=watson.site_20140319cr=workct=usbrb301cn=s1healthcare.
5. Shai Wininger,“The Secret Behind Lemonade’s Instant
Insurance,”Lemonade,November 23,2016,https:stories.lemonade.comthe-secret-
behind-lemonades-instant-insurance-3129537d661.6. Wikipedia,s.v.“Wikipedia:Bots,”accessed August 18,2016,https:en.wikipedia
.orgwikiWikipedia:Bots.
7. Aniket Kittur,Boris Smus,Susheel Khamkar,and Robert
E.Kraut,“CrowdForge:Crowdsourcing Complex Work,”in Proceedings of the ACM
Symposium on User Interface Software and Technology(New York:ACM
Press,2011),http:smus.comcrowdforgecrowdforge-uist-11.pdf.
8. Figure from Kittur A.,Smus,B.,Khamkar,S.,Kraut,R.E.,“CrowdForge:Crowdsourcing
Complex Work.”UIST 2011:Proceedings of the ACM Symposium on User Interface Software
and Technology.New York:ACM Press,http:doi.acm .org10.11452 047196.2047202.? 2011
Association for Computing Machinery,Inc.Reprinted by permission.
9. Simple English Wikipedia,accessed October 21,2017,https:simple.wikipedia
.orgwikiMain_Page.
10. Mar shall McLuhan,Understanding Media(New York:Mc Graw-Hill,1964).
11. 1英寸≈ 0.254米。——编者注
12. 1平方英尺≈ 0.093平方米。——编者注
13. James H.Hines,Thomas W.Malone,Paulo Gonsalves,George Herman,John Quimby,Mary
Murphy-Hoye,James Rice,James Patten,and Hiroshi Ishii,“Construction by
Replacement:A New Approach to Simulation Modeling,”System Dynamics Review
27,no.1(July 28,2010):64-90,http:onlinelibrary
.wiley.comdoi10.1002sdr.437abstract,doi:10.1002sdr.437.
14. Aubrey Colter,Patlapa Davivongsa,Donald Derek Haddad,Halla Moore,Bruan Tice,and
Hiroshi Ishii,“SoundFORMS:Manipulating Sound Through Touch,”in Proceedings of the
2016 CHI Conference Extended Abstracts on Human Factors in Computing Systems(New
York:Association for Computing Machinery,2016),2,425-30.
The photograph is from the above paper and is available online at https:
tangible.media.mit.eduprojectsoundform,where you can also see a fascinating video
of the system in operation.Photograph ? Tangible Media Group,MIT Media
Lab.Reprinted with permission.
15. Erico Guizzo and Evan Ackerman,“How Rethink Robotics Built Its New Baxter Robot
Worker,”IEEE Spectrum,September 18,2012,http:spectrum
.ieee.orgroboticsindustrial-robotsrethink-robotics-baxter-robot-factory -worker.
16. Robert Lee Hotz,“Neural Implants Let Paralyzed Man Take a Drink,”Wall Street
Journal,May 21,2015,http:www.wsj.comarticlesneural-implants-let-paralyzed-man-
take-a-drink-1432231201;Tyson Aflalo,Spencer Kellis, Christian Klaes,Brian Lee,Ying
Shi,Kelsie Shanfield,Stephanie Hayes-Jackson,et al.,“Decoding Motor Imagery from
the Posterior Parietal Cortex of a Tetraplegic Human,”Science 348,no.6,237(May22,2015):906-910,http:science.sciencemag.orgcontent3486237906.full,doi
:10.1126science.aaa5417.第4章
计算机将能达到什么样的通用智能水平?
与许多重要的概念一样,人工智能这个术语很难定义。 有些人用它来指
代“像人类一样能够思考或行动的机器”。例如,著名的图灵测试 认为,如果向
计算机提问的人无法判断答案是来自人类还是机器,这台计算机就可以被视为“智
能”的。人工智能的另一个定义是“能理性行动的机器”,哪怕它们的做事方式与
人类不同甚至有可能比人类更佳。例如,尽管谷歌搜索算法几乎不可能以人类记忆
事情的方式来“记住”网页,但在找到谷歌用户正在寻找的网页方面,它表现得非
常好。
或许,人工智能最简单的定义是“由机器展现出的智能”。 然后,根据第1章
中我们对智能的定义,可以说人工智能就像人类智能一样有专业和通用之分。
关于今天的人工智能,大多数人都没有意识到的最重要的事情之一,就是它们
都非常专业化。 尽管谷歌搜索引擎十分擅长检索有关棒球比赛的新闻报道,但它
并不能独立写出关于你儿子所在的少年棒球联赛的文章。尽管IBM公司的超级电
脑“沃森” 比最优秀的人类更擅长玩《危险边缘》智力问答游戏,但它的程序版
本却不会玩井字棋,更不用说国际象棋了。特斯拉公司的自动驾驶汽车十分擅长在
标示清晰的车道上行驶,但它们不能从仓库货架上取下一个盒子,并把它送到打包
站。
当然,也有能做到其他事情的计算机系统。但关键问题在于,它们全都是不同
的专业化程序,而不是能在每种特定情境中知道该做什么的通用人工智能。在每种
情况下,人类都必须利用他们的通用智能编写包含解决不同的具体问题所需规则的
程序,还要决定在特定情况下应该运行哪些程序。
如果有可能,机器什么时候将真正拥有通用智能?如果目前这种状况会发生改变的话,最快将是什么时候呢?有些人认为,机器
永远无法胜任人类做的那些精妙和智慧的事情。换句话说,他们认为机器永远不会
拥有通用智能。
在某些情况下,这种观点的哲学依据是,即使机器能做到人类做的所有事情,它仍然算不上真正拥有了智能,因为只有人类才拥有智能。 我承认,我完全无法
接受这个观点。对我来说,这就好比问计算机科学家艾兹格·迪科斯彻(Edsger
Dijkstra)问过的那个问题:“潜艇会游泳吗?” 由于鱼和潜艇都是靠自身力量
在水中移动的,你用哪个词来描述这种现象,是一个纯粹的语义学问题。在英语
中,将“swim”(游泳)与潜艇搭配在一起听起来有些奇怪,但在俄语中听起来则
非常自然。 换句话说,这场争论的焦点并不是事实,而只是我们想如何定义用于
描述这些事实的词语。
同样地,机器能否拥有智能的哲学问题,实际上只是关于我们想如何定义“智
能”这个词的争论。在我看来,正如我们在第1章中所做的,以一种可以将机器包括
在内的方式定义人工智能是完全合理的。
还有人认为,机器永远无法拥有通用智能,因为实现这一目标所需解决的实际
问题太难了,我们根本解决不了;或者即使我们能解决它们,需要花费的时间也将
远远超出现在活着的所有人的寿命。这种说法明显是站不住脚的。我以前的学生、现在的同事埃里克·布莱恩约弗森(Erik Brynjolfsson)和他的合著者安德鲁·麦
卡菲(Andrew McAfee)认为,计算机硬件的不断进步和人工智能的惊人发展速
度,可能很快就会使机器拥有通用智能。 而人工智能专家罗德尼·布鲁克斯
(Rodney Brooks)则认为,这可能需要几百年的时间。
事实上,从20世纪50年代,也就是人工智能发展早期开始,这一领域的进展就
一直是出了名的难以预测。例如,研究人员斯图尔特·阿姆斯特朗(Stuart
Armstrong)和卡伊·索塔拉(Kaj Sotala)对1950~2012年的95个关于通用人工智
能将在何时实现的预测进行了分析。 他们发现,不管预测是在什么时候做出的,专家和非专家都倾向于认为通用人工智能将在未来的15~25年内实现!换句话说,在
过去的60年里,通用人工智能似乎一直距离我们“20年”之遥。
新近的调查和访谈结果与这种长期模式也是一致的:人们仍然预测通用人工智
能将在未来的15~25年内实现。 所以,尽管我们并不知道确切答案,但至少有良好的理由对通用人工智能将在“未来几十年”内出现的自信预测表示怀疑。我个人
的观点是,如果不发生一些重大社会灾难,通用人工智能很有可能会在未来的某一
天出现,不过也许是在好几十年之后。
计算机编程难在哪里?
要理解通用人工智能为什么如此难以实现,你需要先了解计算机编程难在哪
里。如果你从事过任何重要的计算机编程工作,那么你已经直接经历过相关挑战
了。但如果你没有这方面的经历,我会尽力让你对它有一个快速的基本认识。
基本问题在于,所有现代数字计算机的核心都是“处理器”,从某种意义上
说,处理器是非常愚蠢的。我在给读MBA(工商管理学硕士)的学生上基础信息技术
课时,用到了我在麻省理工学院的同事斯图尔特·马德尼克(Stuart Madnick)提
出的一个类比,来帮助人们理解这些处理器能做什么。马德尼克描绘了一台虚构的
计算机,叫作“小矮人计算机”。 这台虚构计算机包含一位在一个小房间中工作
的小矮人(见下图)。但是,这个小矮人很愚笨,他只能做大约10件非常简单的事
情。这个小房间的墙上有一个收信箱和一个发信箱,他可以通过它们和每张写着一
个三位数的纸条与外界交流。房间里还有一块黑板,上面包括100个用编号标记的位
置,他可以在这里读取和写入三位数。他还有一个计算器,用于对这些三位数进行
加减运算。每当这个小矮人做完一件事时,就会看看他之前写在黑板的某个位置上的数
字,然后把这个数字解读为他要执行的“指令”,从而决定接下来做什么。例如,如果指令是“901”,他就知道这个代码意味着他应该在计算器中输入收件箱中的数
字。如果指令以1开头,他就知道这意味着要“做加法运算”。例如,如果指令是
145,就意味着他应该把黑板上的45号位置对应的数字与计算器里的数字相加。
他有大约10条这样的指令,每条指令都有不同的代码,分别代表着输入和输出
数字、加减运算,以及增减黑板上的数字等任务。通常,他会按照指令在黑板上的
先后顺序来做事。但是,有时他也必须决定下一步该做什么。所以,他还有两个附
加指令,即依据计算器中的数字是0还是大于0,决定应该在哪个位置寻找他的下一
条指令。
为了弄清楚“小矮人计算机”的工作原理,我们假设这个小矮人需要把10个数
字加起来。要完成这项任务,他不仅需要把这些数字加在一起,还需要记录他加过
的数字个数。他可能会在黑板的某个位置上记录已经加过的所有数字的和,并在另
一个位置上记录他已经加过的数字个数。每当把一个新数字加到总和当中时,他也
会在数字的总个数上加1。然后,为了判断是否加完了所有10个数字,他可以用10减
去数字的总个数。如果结果大于0,就意味着他还没有加完所有10个数字,因此他会
继续执行加上一个新数字的指令。但如果结果是0,他就会到黑板的另一个位置上去寻找一组指令,比如,让他把运算结果放入发件箱。
这就是小矮人能做的所有事情。他只是遵照10条左右简单指令的不同组合做
事。在他的黑板上,一部分内容是告诉他该做什么的指令,这些指令构成了小矮人
的运行“程序”;另一部分内容就是他处理的“数据”。如果没有程序告诉他该做
什么,他就什么都做不了。而且,他使用的程序必须把他要做的每件事情分解成一
个个小步骤。
其神奇之处就在于,无论一台现代计算机在做什么——不管是将你最新的自拍
照发送给你在脸书网上的所有好友,还是决定何时让你的自助驾驶汽车减速——实
际上它都在执行大量非常简单的指令,这些指令的内容和小矮人能做的事情基本上
没有什么区别!当然,现代计算机可以访问“黑板”(存储器)的几百万个位置,在数量上远超小矮人计算机。这些位置存储着二进制数字(1和0),而不是我们通
常使用的十进制数字。而且,现代计算机每秒钟可以执行好几百万条指令,比任何
人都要快得多。尽管如此,它们做的所有事情实际上都只是简单指令的复杂组合。
难点在于,不管一个人想让计算机做什么,都必须为它编写一套指令。弄明白
如何让计算机通过执行它能真正理解的简单指令来完成复杂任务,是极其困难的一
件事。
这就是软件开发人员一天到晚都在做的事情,而且为了提高计算机的工作质量
和效率,他们已经开发出各种各样的技术。例如,几十年前,软件开发人员想出了
利用“高级编程语言”(像今天的Java和C语言)来编写程序,然后让其他程序(编
译器)把这些程序翻译成计算机真正需要的特定(机器语言)指令的方法,从而把
人从辛苦烦琐的编译工作中解放出来。
但是,即使有了这些强大的技术,编写计算机完成任务所需的详细指令(也被
称为程序、代码、算法或规则),对人类程序员来说也是一项繁重的工作。就算对
像会计系统这样相对简单的程序来说也是一样,更不用说复杂的人工智能程序了。
有一个事实会让你对这些程序的复杂程度有一个大致的了解:谷歌公司估计,它的
所有服务使用的高级语言版本的软件包含大约20亿行代码。
通向通用人工智能的可能路径那么,通用人工智能有望实现吗?当然有。尽管编写计算机程序很难,但我们
已经在研发具备各种能力(包括多种专业人工智能)的计算机方面取得了长足进
步。而且,我们已经掌握了许多其他类型的编程技术和计算机体系结构,这可能会
让我们离实现通用人工智能的目标更进一步。
让我们来看看其中几个可能的路径。
常识
想一想,要理解下面这一小段对话,你需要知道些什么:
人物A:我头痛。
人物B:街角的药店下午6点关门。
当然,你需要知道A和B对话使用的这些字词的意思。不过,你还需要知道其他
一些关于这个世界的事实,包括但不仅限于:
头痛是一种疾病;
患病的人通常会感到不舒服;
人们通常会尽量避免令人不舒服的事情;
服用药物是避免疾病带来的不适感的一种方法;
一种获得药物的方法是去药店购买;
只有在药店的营业时间,你才能买到药。
因此,对一台要像人类一样“理解”这一小段对话的计算机来说,它必须了解
所有这些事实。现在,把这几项具体事实以一种能让计算机对它们做一些推理的格
式进行编码和编程,并不太难做到。但是,哪怕只是朝通用智能的目标前进一小
步,这几项事实在需要掌握的数百万条关于这个世界的事实中只不过是沧海一粟。
当然,人类在孩童时期就学过这些东西,而且由于我们了解它们,所以在我们看来
它们是显而易见的。我们只把它们当作常识。但是,计算机必须以某种方式获取上百万条这样的事实。要想实现这一点,最
明显的方法就是让人类程序员编写出能对这些知识以机器可以利用的格式进行编码
的程序。
在这个方面最具雄心的尝试可能来自计算机科学家道格·莱纳特(Doug
Lenat),他于1984年发起并领导开展了Cyc项目。 从那时起,道格及其同事花了
很多时间,煞费苦心地将几百万条事实(关于疾病、天气和政治等主题)编入了一
个供计算机使用的大型常识数据库。
尽管这个路径将在多大程度上推动通用人工智能的实现还是未知数,但与此同
时,它已经被应用于一些项目,例如,帮助克利夫兰医学中心的医生找到临床研究
所需的患者,这些患者具有某些临床表现,比如有“心包开窗术后发生细菌感
染”的病史。
大数据
近年来,在开发有效的人工智能方面取得的显著进展,有时得益于我们能以比
过去更便捷的方式获取大量的可用数据。
例如,人类语言(比如英语和西班牙语)的机器翻译,一直是人工智能研究领
域的“圣杯”之一。几十年来,研究人员对实现这一目标的进展之缓慢备感失望。
但最近语言翻译程序取得了很大进步,部分原因在于大量翻译文档的可用性。例
如,谷歌翻译利用联合国的文件(通常由联合国的译员翻译成至少6种语言),计算
一种语言中的某个短语对应于其他语言中的不同短语的频率。例如,西班牙语中的
短语“darse cuenta”通常被翻译成英语中的“realize”(认识到),而不是直
译为“give account”(支出账户),这样一来,谷歌翻译就学会了该如何翻译
它。这个路径的关键之处在于,它不要求人类程序员掌握语言的所有复杂规则和习
惯用法,而只需要有能用一套较为简单的规则进行分析的大量可用文本。
机器学习
让计算机更智能的一个相关路径是,聚焦于开发计算机学习的方法。这样一
来,人类程序员就无须编写非常详细的规则,告诉计算机如何完成它们需要做的每
件小事,而只需编写能告诉计算机应该如何学习的一般规则,然后让计算机根据它们自己的经验来决定如何做其他事情。这种前景光明的路径叫作机器学习,其灵感
来源于人类的学习方式。人类天生就拥有深植于大脑的学习能力,而且在习得专项
能力时,不像今天的计算机那样需要有人为他们详细“编程”。
当然,没有人确切地知道人类是如何做到这一点的,而且通过编程让机器像人
类那样学习比听起来要困难得多,不过研究人员已经在这个方向取得了重要进展。
在某些情况下,他们会利用所谓的监督学习,也就是程序通过被告知对错来学习。
例如,如果你想训练一个程序去识别图片中是否有人脸,那么你可以给它看几千张
图片,并告诉它哪些图片中有人脸,而哪些没有。随着时间的推移,这个程序可以
调整它的统计参数,从而越来越擅长根据它赋予不同底层特征组合(比如,圆圈和
线在图片中的位置)的权重,预测哪些图片中有人脸。
如何进行所谓的无监督学习,这是一个难度更大的问题。这个概念是指你给了
计算机很多例子,但不告诉它你想让它从这些例子中学什么。如果你思考一下,就
会发现这正是我们人类了解这个世界的主要方式。例如,大多数婴儿都是在没有任
何人给他们明确解释引力的情况下,就习得了它的作用机制。
在最近有关计算机无监督学习的研究中,令人印象最深刻的一个是,一个由斯
坦福大学和谷歌公司的研究人员组成的团队,把来自YouTube视频的1 000万幅数字
图像提供给一个计算机系统,并让它寻找其中的规律。在研究人员没有告诉系统寻
找什么的情况下,它学会了识别包括人脸、人体和猫脸在内的两万种对象。 这个
系统利用一个被称为深度学习的路径实现了机器学习,该路径大致模拟了人脑中不
同层次的神经元之间的相互连接方式,具有特别光明的发展前景。
神经形态计算
要想创造出更智能的计算机,还有一个有趣的路径是研发出更接近人脑结构的
新型计算机硬件。“小矮人计算机”代表的是一次只执行一条指令的数字计算机,而且我们使用的几乎所有计算机都是以这种方式设计的。然而在最近几年,配备了
多核处理器的计算机越来越多,这相当于有几个小矮人在同一台计算机内并行工
作。
不过,人类大脑拥有与计算机截然不同的结构。人脑中并非只有一个甚至是几
个处理器在并行工作,而是有800亿~1 000亿个被称为神经元的处理器。 神经元以非常复杂的方式相互连接,而且从某种意义上说,所有神经元都在并行工作。尽
管在一台传统的数字计算机上对这种复杂性进行模拟原则上是可能的,但在实践中
创造出真正拥有数十亿个处理器在并行工作的计算机,可能才是更加可行的途径。
这样一来,通过编程让这些更像人脑的计算机以更接近人脑的方式运行,也许就会
容易得多。要做到这一点,我们需要使用一种与以前截然不同的计算机硬件的设计
方法,这是包括IBM、休斯研究实验室(HRL)等很多研究小组正在追求的目标。
通用人工智能会成为集体智能的一种形式吗?
上面提到的最后一个路径催生了一个有趣的可能性。我们知道人类大脑本身就
是集体智能的一种形式,它由几十亿个独立神经元构成,当作为一个整体运转时,这些神经元的行为方式看起来很智能。
因此,真正创造出通用人工智能的最佳方法之一可能是,在单个系统内部将许
多种不同的人工智能(比如我们刚刚提到的那些)结合起来,从而创造出一种集体
智能。事实上,人工智能之父马文·明斯基(Marvin Minsky)在他的著作《心智社
会》中也提到了这一点。在明斯基看来,一个心智社会是由许多较小的“智能
体”间的相互作用形成的,尽管这些智能体作为个体而言智能水平并不高,但他们
会共同创造出一个 ......
作者:[美]托马斯·W.马隆
译者:任烨
ISBN:9787521709209
中信出版集团制作发行
版权所有·侵权必究献给我的父母
欧内斯特·马隆(Ernest Malone)
和
维吉尼亚·马隆(Virginia Malone)前言
在英语中,“supermind”(超级思维)这个词的意思是“多种个体思维形成的
强大组合”。 本书要讲述的正是超级思维在我们这个星球上的发展历程。我们会
看到人类的历史在很大程度上就是人类超级思维的历史,也就是以群体(比如层级
制、社群、市场和民主制)为单位的人,如何完成了仅凭一己之力绝不可能做到的
事情。
更重要的是,我们还会看到计算机将对人类超级思维的未来发展产生多么关键
的影响。在很长一段时间里,计算机最重要的贡献不是人工智能,而是“超级连
接”(hyperconnectivity),即以全新的方式和空前的规模将人类的思维彼此连接
起来。不过随着时间的推移,计算机也会完成越来越多如今只有人类才能胜任的复
杂思考。
本书探讨的主要内容并不是计算机将如何完成人类过去常做的事情,而是人类
和计算机将如何共同完成以前绝不可能做到的事情,人机超级思维又将如何成为我
们这个世界有史以来智能水平最高的工具,以及我们将如何利用这些新型的集体智
能来解决企业、政府和其他社会领域中的一些最重要的问题。
1. Collins English Dictionary, s.v.“supermind,” accessed April 30, 2017,https:www.collinsdictionary.comusdictiona.ryenglishsupermind.引言
2009年1月,蒂姆·高尔斯(Tim Gowers)发布了一则创造历史的博客。高尔斯
是剑桥大学的数学教授,证明数学定理就是他谋生的方式。如果你像大多数人一
样,那么你可能一辈子都没有证明过一条定理;或者至少在上完高中的几何课之
后,再也没有证明过一条定理。然而,数学证明展现出来的严谨的逻辑思维,正是
人类的很多最重要的科技成就得以实现的关键。
通常,证明定理需要独立工作好几个小时,才能想出如何完成一个复杂证明的
某个部分的一个片段。2009年,高尔斯决定尝试用一种不同的方式来做这件事,他
想看看互联网上的大量用户能否一起证明一条定理。
在一篇题为《大规模协作的数学运算有可能实现吗?》的博客文章中,高尔斯
向互联网上所有对协作证明定理感兴趣的人发出了邀请。 他推测这种大规模的协
作可能会有用,原因至少有以下三点。第一,在各种解决问题(包括数学证明)的
过程中,运气往往很重要。让很多人来解决一个问题,可以增加有人走运并想到好
主意的概率。
第二,不同的人了解的知识不同。所以,即使所有人都只提出对他们来说显而
易见的观点,整个群体能获取的知识也比一两个人能获取的知识多得多。
第三,不同的人有不同的思维方式。有些人善于提出可供尝试的新点子,有些
人善于在别人的想法中寻找漏洞,还有些人则善于将大量的碎片整合成条理连贯的
新观点。正如高尔斯在博客中概括的那样,“……如果一大群数学家的头脑能有效
地连接起来,或许他们能更高效地解决问题”。
接着,高尔斯又提出了几条能让协作变得更加简单的基本规则,比如讨论时保
持礼貌,发言简洁精练。在随后的一篇博客文章中,他发布了证明黑尔斯–朱厄特
(Hales-Jewett)定理的任务,该定理是应用于计算机科学及其他领域的一个只有
少数人了解的数学分支的一部分。很快,其他数学家就接受了高尔斯的挑战。在高尔斯发布这篇博客文章后不到7
个小时,加拿大不列颠哥伦比亚大学的数学家约瑟夫·索利摩斯(Jozsef
Solymosi)就发表了第一条评论。15分钟后,美国亚利桑那州的一位高中数学教师
詹森·戴尔(Jason Dyer)发表了第二条评论。又过了3分钟,加州大学洛杉矶分校
的陶哲轩(Terence Tao,他和高尔斯都获得过相当于数学界的诺贝尔奖的菲尔兹
奖)也发表了评论。
到2009年3月中旬,参与者已经解决了这个问题的核心部分。到5月底,在1 500
多条评论中,有39人的发言具有实质性意义。10月,该团队发表了描述他们研究成
果的第一篇论文,而且他们所有论文的署名都是“D. H. J. Polymath”,这是为整
个团队起的一个笔名。
由于有多位著名的数学家参与其中,所以你可能会怀疑这到底是不是一个团队
项目,或者说关键工作是不是由少数最具名望的参与者完成的。事实上,尽管团队
中的一些成员做出的贡献的确比其他人大,但在对项目的所有工作记录进行详细分
析后,我们发现39位主要参与者中的几乎每个人都贡献了有影响力的观点。
换句话说,博学项目(Polymath Project)创造了历史,因为这是由几十位互
联网用户组成的松散团队,在数学领域做出真正贡献的第一个案例,他们中的很多
人在项目开始之前互不相识。
古老的思想渊源
博学项目的成功得益于利用了新的信息技术,以过去完全不可能的方式把人联
系在一起。在本书中,我们将会看到很多这样的例子:庞大的在线群体创作出一
部“百科全书”(维基百科),解决科学难题(蛋白质折叠电子游戏Foldit),彼
此闲聊(脸书),以及对像飓风这样的人道主义灾难做出响应(非营利性危机预警
平台Ushahidi)。
但在某种意义上,这些数字时代的成就都只印证了人类文明史中的一个最古老
的故事。这个故事是这样的:“出现一个问题,不同的人负责处理这个问题的不同
部分。总的来说,比起个人的单打独斗,群体能更好地解决问题。”事实上,毫不夸张地说,我们的几乎所有重要的问题都是由群体解决的,而不
是仅凭一己之力完成。比如,人们也许常说史蒂夫·乔布斯发明了iPhone(苹果手
机),但实际上iPhone无疑是由世界各地的几千人设计和制造出来的,而他们依靠
的也是前人留下的诸多技术发明。哪怕只是制作我今天午餐要吃的火鸡三明治,也
需要几百人来种植、运输和准备肉类、面包、生菜、芥末和其他原料。
与这些“简单”的问题相比,像如何应对气候变化、犯罪、战争和贫困,以及
如何改善医疗保健和教育之类的社会问题复杂得多,需要的人力也多得多。
在有助于有效解决问题的能力中,有一种叫作智能,而且我们通常认为智能是
个体拥有的一种能力。但我们从前文的所有例子中可以明显看出,从解决问题的意
义上说,智能也可以是群体拥有的一种能力。
我们把群体的智能称为集体智能,本书要讨论的就是这种无处不在却常常被忽
视的智能。我们将会看到,最先将人类的祖先和它们的动物近亲区别开来的东西正
是人类的集体智能,而不是人类的个体智能。我们将会看到,人类的进步主要是由
群体而不是个体完成的。我们将会看到,随着时间的推移,信息技术(比如书写和
印刷)使得群体规模显著增大,智能水平也大幅提高。
最重要的是,我们将会看到,人类目前正处于集体智能的另一次巨变的早期阶
段,触发这次变革的是电子信息技术。不过,在想象集体智能的未来发展之前,我
们有必要先简要地回顾一下它的过去。
集体智能简史
我们做一个思想实验:想象你搭乘着时间机器来到公元前45 000年非洲的一片
热带雨林。尽管你的知识水平和现在一样,但你却是孤身一人。天气炎热、潮湿,四周还传来很多奇怪的声响。如果你走运,或许能依靠水果、坚果和其他食肉动物
留下的猎物尸体,以及你偶尔抓到的鱼或者蚱蜢活下来。不过,你终将成为食物链
的一环,一直活在对比你强大的捕食者的恐惧中。 例如,如果你偶然碰到一头饥
饿的狮子,那么你很可能会成为它的午餐,而不是你吃掉它。
我们人类的远祖也曾面临这样的境况,但主要的区别在于,远古人类并不是孤身一人,而是过着群居生活。事实上,他们的大脑天生就有建立相互联系的能力。
相较于与人类体型相似的动物的大脑,人类的大脑是目前动物界中最大的。而且,在多出来的脑容量中,有很大一部分似乎就是服务于社交智能的。
如果你检视包括猴、猿和人类在内的所有灵长类动物,就会发现新皮质区域越
大的物种,形成的社会群体也越大。 有效融入更大的社会群体的能力,是人类大
脑的最重要的进化优势之一。
这背后最主要的原因或许是,群体比个体能更有效地保护他们免受捕食者的伤
害。 群体中的少数人可以在其他人吃杧果的时候,密切注意狮子的动向。狮子也
不太可能攻击一大群人,因为它知道即便能轻易地制服一个人,也很可能在与十几
个人的战斗中失败。当人类成为捕食者时,庞大的群体变得更加有效。比如,由几
十个人组成的群体可以把一整群野马团团围住,然后将它们赶进峡谷,一网打尽。
除了卓越的社交智能外,早期人类还发展出比其他动物更丰富的沟通方式。这
些人类语言不仅可用于协作狩猎,还可用来分享创意,例如,怎样控制火,怎样制
作弓箭,以及怎样造船。
即使那些会取火的“阿尔伯特·爱因斯坦”——不管他们是谁——如果无法将
他们掌握的技术传播给别人,也不会给这个世界带来多大的改变。他们的创新之所
以有影响力,只是因为他们的创意为很多人和群体共享,后者可以进一步应用和发
展它们。
在30 000~70 000年前,我们人类的祖先已经拥有了与现代人类别无二致的身体
和大脑, 并凭借他们的能力在世界上占据越来越高的地位。例如,人类在大约45
000年前到达澳大利亚海岸。之后在几千年的时间里,这片大陆上其他24种体型最大
的动物中有23种已经灭绝了。
虽然我们没有任何关于人类屠杀动物的目击报告,但以狩猎采集为生的人类祖
先最终还是以某种方式到达了食物链顶端。而且,成为顶级捕食者的是人类群体,而不是个体。
农业类似的故事也发生在人类的另外两个主要发展阶段:农业革命和工业革命。在
大约12 000年前,人类开始系统地培育小麦、玉米、奶牛和其他很多动植物。这使
得全球人口从大约200万增长到1700年的6亿,进一步巩固了人类对大自然的其他部
分的统治。
但是,农业比狩猎和采集需要更多和更大规模的群体协作。农民种植粮食,但
他们通常不会自己盖房子,盖房子的木匠又需要从农民那里获取粮食。于是,人们
就在市场上用他们拥有的东西来交换他们需要的东西。随着农业社会的发展,庄稼
和房屋也需要保护,免受侵略者和窃贼的破坏。在这个问题上,人们通常会依赖于
由国王和皇帝统治的政府。
上述成就全都依赖于人类的集体智能和技术,仅凭一己之力根本不可能做到。
像书写这样的信息技术尤为重要,因为它们让原本不可能实现的跨越时空的沟通成
为现实。
工业
从18世纪开始,随着人类开办工厂、发明机器,工业时代的大幕被缓缓拉开,劳动分工和各种各样更复杂的协作得到了进一步发展。与新的分工方式相结合的新
技术使生产率得到大幅提升。比如,经济学家亚当·斯密就曾以著名的大头针工厂
的例子来说明劳动分工的重要性。在这家工厂里,原先一位制针工人要完成的任务
被分解成切断金属丝、打磨针尖等18项单独的任务,而且每一项任务都由不同的专
业工人来完成。在更大规模的群体当中,这样的分工方式可以大大地提高生产率。
在工业时代,除了规模更大的市场和政府,还出现了规模更大的社群,比如世
界科学界,让新的互动方式成为可能。这些变化都依赖于信息技术的进一步发展,包括印刷术和我们今天知道的各种电子通信技术。所有这些进步的结果是,世界人
口再次增长,仅在过去的300年里就从6亿增加到70多亿。人类对地球的统治如此成
功,以至于现在人类自身也许才是地球未来的最大风险。
同样地,这些发展也不只是人类个体智能的结果。大概没有一个人会说:“我
希望人口能够尽可能地增加,这样一来,人类就可以统治大自然了。”事实上,这
些结果无论好坏,都是人类的集体智能和技术共同造就的。集体智能到底是什么?
把由人和计算机组成的群体视为一种超个体,也许看起来就像一个富有诗意的
隐喻。但我们将会看到,这个观点从很多方面来说都是相当准确的。事实证明,人
类群体和人类个体一样,都有可进行科学测量的属性。我们将会看到,研究表明,心理学家用来测量个体智能的统计方法也可用于测量群体智能的衡量。在这个过程
中,我们将会看到有些群体确实比其他群体睿智,我们也将更准确地理解其中的原
因。
我们也将看到,我和我的一位同事在研究中采用神经科学家开发的一种用于测
量意识的方法,去分析人机群体中的交互模式。我们发现,最高效的群体也是交互
模式与有意识的人脑最相像的群体。这是不是意味着那些群体真的“有意识”呢?
尽管答案是否定的,但我们将会看到,有很多原因表明这种想法可能并不是痴人说
梦。
我们还将看到,一个群体自身的意愿往往与群体中个体的意愿不一致。比如,即使在对员工没有任何益处的情况下,公司也常会做对其自身利润有益的事情,这
毫不奇怪。民主政府常会做出公民不喜欢的选择;市场会无情地将食物、房屋和其
他各种资源分配给出钱最多的人,即使这样做会让其他人几乎一无所有。
所以,从某种重要的意义上说,这些具有集体智能的“生物”确实拥有超越个
体的“生命”。我们把这种生物称为超级思维。在这里,“超级”并不一定意味
着“更好”,而只意味着“更具包容性”。换句话说,正如超个体(比如,一个蚁
群)包含其他生物(比如,个体蚂蚁)一样,超级思维(比如,一家公司)也包含
其他思维(比如,公司员工的想法)。
和动植物个体一样,超级思维也可以被分成多个“物种”。我们将详细了解以
下4个重要的类别:
层级制:当权者做出决策,其他人必须服从。存在于企业、非营利组织和
政府的运营部门中。
民主制:通过投票做出决策。存在于政府、俱乐部、企业和很多其他群体
中。市场:根据贸易伙伴间的双方协议做出决策。存在于人们进行金钱、商品和
服务交易的任何地方。
社群:通过非正式的共识或共享的规范做出决策。存在于人类生活的方方面
面,从本地社区到职业群体再到国家文化。
所有这些不同类型的超级思维一直在相互作用:有时协作,有时竞争,有时则
彼此毁灭。当你从这个角度看待世界时,你可能会发现今天的新闻大多都与这些不
同类型的超级思维的冒险活动有关。
这里有几个例子:一是以苹果与三星为代表的层级制公司,争夺全球智能手机
市场的主导地位。二是美国民主制度下的自由派与保守派就医疗保健问题到底应该
通过自由市场、政府层级制度还是二者的某种组合才能得到更好解决的议题展开争
论。三是美国最高法院(层级制政府中的一个带有些许民主色彩的部门)就“联合
公民诉联邦选举委员会案”做出裁决,认定大型层级制企业用金钱影响民主选举的
行为是违法的。四是地方社区对层级制政府试图规定跨性别者可使用的洗手间的法
令表示反对。
所有这些事件都发生在最后一种能涵盖其他所有超级思维的背景之下:
生态系统:依据谁拥有最大的权力和最强的生存繁衍能力做出决策。存在
于缺乏总体合作框架的任何地方,比如我们在上文中看到的各种不同类型的超级
思维之间的冲突。
和自然界中的生态系统一样,生态系统超级思维也是按照“弱肉强食,适者生
存”的法则运行的,只有行之有效的超级思维才能获得回报。
这就意味着,不管我们喜欢与否,在任意特定时间存在于某个生态系统的个体
和超级思维,在过去都是强大和成功到足以生存或繁衍的。这种对生存的渴望,或
许就是超级思维有独立于其成员的自我意愿的最重要原因。不过,令人吃惊的是,对超级思维有利的东西往往也对个体有利。
作为个体,我们通常不得不依靠各种各样的超级思维,解决这个世界面对的大
问题。但是,我们有时也能影响既有的超级思维,或者创造出新的超级思维来处理
对我们而言很重要的问题。在这个过程中,我们应该把赌注押在最适合手边问题的超级思维上。为了帮助你做出恰当的选择,我们会对不同类型超级思维的一些关键
的优势和劣势进行分析。
信息技术如何让超级思维变得更智能?
为了弄清楚信息技术将如何改变世界,我们需要理解目前驱动世界运转的超级
思维。不过,我们也需要了解新一代电子信息技术将如何从根本上改变这些超级思
维。
现在,许多人认为最重要的新型信息技术是人工智能(AI),因为它能让机器
人和其他软件程序去做以前只有人类才能做到的事情。当然,像亚马逊公司的
Alexa(人工智能语音助手)和谷歌公司的自动驾驶汽车这样的产品确实越来越智能
了。而且,在未来的某一天,我们有可能会拥有像人类一样聪明和适应性广的人工
智能机器。
但大多数专家都估计,至少在几十年或者更长的时间内它不可能成为现实。在
此期间,我们对人工智能的利用也离不开人类的参与,因为后者能提供机器本身尚
不具备的各种技能和一般智力。
在可预见的未来,信息技术的另一种用途甚至比单纯地创造更好的人工智能更
重要,那就是建立人机群体,并展现出比以往任何时候都强得多的集体智能。
我们常常高估人工智能在这方面的潜力,又常常低估存在于地球上大约70亿个
信息处理能力惊人的人类大脑间的超级连接的潜力,更不用说其他几百万台不包含
人工智能的计算机了。
我们很容易高估人工智能的潜力,因为我们很容易想当然地认为计算机像人一
样聪明。我们已经知道人类是什么样子,而且科幻电影和小说中的很多故事都与智
能计算机有关,比如《星球大战》中的R2–D2(宇航技工机器人)和邪恶的终结者
生化电子人,它们的行为表现就像我们已经了解的好人和坏人一样。不过,要创造
出这样的机器可比想象它们难多了。
另外,我们之所以会低估超级连接的潜力,或许是因为创造出庞大的人机群体
连接网络比想象它们到底能做什么更容易。事实上,到目前为止,我们使用计算机主要是为了与他人联系。在电子邮件、移动应用、网络和像脸书、谷歌、维基百
科、网飞、YouTube视频和推特等这类网站的帮助下,我们已经创造出世界上前所未
有的规模最庞大的人机群体。
但对我们来说,要理解这些群体当下的作用仍然很难,而要想象它们在未来将
如何变化则难上加难。本书的目标之一就是帮你想象各种可能性,以及它们将如何
帮助我们解决最重要的问题。
比如,我们将会看到,信息技术如何帮助我们创建规模更大的群体、更具多样
性的群体、拥有全新组织方式的群体,以及结合了人类智能与机器智能的群体,从
而做到过去绝不可能做到的事情。换句话说,我们要探究的是集体智能的核心问题
之一:
人与计算机如何才能连接起来,并达到任何个人、群体或者计算机都从未达
到的智能水平呢?
超级思维如何帮助我们解决问题?
超级思维要想具备实用性,就必须解决我们关心的问题。为了说明其中的某些
可能性,我们将会看到几个在企业战略规划、应对气候变化和管理人工智能风险的
过程中,如何利用超级思维解决问题的例子。
我们也将看到,在地球上集体智能的发展显然是有终点的,它就是“全球思
维”,即地球上所有人、计算机和其他类型的智能的组合。 我们将会看到,在某
种程度上,全球思维已经存在,而且其智能化水平一直在提高。 最后,本书将针
对我们应该如何利用全球思维做出既聪明又明智的选择进行一些思考。
1. Timothy Gowers and Michael Nielsen,“Massively Collaborative Mathematics,”
Nature 461, no.7266 (2009):879-81,doi:10.1038461879a;Justin Cranshaw and Aniket
Kittur,“The Polymath Project:Lessons from a Successful Online Collaboration in
Mathematics,”in Proceedings of the SIGCHI Conference on Human Factors in Computing
Systems(New York:Association for Computing Machinery,2011),1,865-
74,doi:10.11451978942.1979213.2. Timothy Gowers,“Is Massively Collaborative Mathematics Possible?”Gowers’s
Weblog,January 27,2009,http:gowers.wordpress.com20090127is-massively-
collaborative-mathematics-possible.
3. D.H.J.Polymath,“Density Hales-Jewett and Moser Numbers,”preprint,submitted
February 2,2010,https:arxiv.orgabs1002.0374;D.H.J.Polymath,“A New Proof of the
Density Hales-Jewett Theorem,”preprint,submitted October
20,2009,https:arxiv.orgabs0910.3926.
4. Cranshaw and Kittur,“The Polymath Project.”
5. Yuval Noah Harari,Sapiens:A Brief History of Humankind(New
York:HarperCollins,2015),11.
6. The dimension on which humans excel is called the encephalization quotient.See
M.D.Lieberman,Social:Why Our Brains Are Wired to Connect(New
York:Crown,2013),29;Gerhard Roth and Ursula Dicke,“Evolution of the Brain and
Intelligence,”Trends in Cognitive Sciences 9,no.5(2005):250-
57,http:dx.doi.org10.1016j.tics.2005.03.005;Robin I.M.Dunbar,“Neocortex Size as
a Constraint on Group Size in Primates,”Journal of Human Evolution
22,no.6(1992):469-93,doi:10.10160047-2484(92)90081-J;Robin I.M.Dunbar,“Coevolution
of Neocortical Size,Group Size and Language in Humans,”Behavioral and Brain
Sciences 16,no.4(1993):681-94,https:doi .org10.1017S0140525X00032325;Robin
I.M.Dunbar,Grooming,Gossip,and the Evolution of Language(Cambridge,MA:Harvard
University Press,1998);Robin I.M. Dunbar and Susanne Shultz,“Evolution in the
Social Brain,”Science 317,no.5,843(2007):1,344-47,doi:10.1126science.1145463.
7. Dunbar,“Neocortex Size as a Constraint.”
8. Dunbar,Grooming Gossip,and the Evolution of Language,17-18.
Dunbar gives several examples of primates acting in groups to defend against
predators.But if you are a stickler for the historical plausibility of hypothetical
examples,you may be wondering whether lions and mangoes ever existed together in
ancient times as I posited here.The answer is:they probably did.Lions were common in
Africa,and so were African mangoes.See Wikipedia,s.v.“lion,”accessed February
11,2018,https:en.wikipedia.orgwikiLion;“Historic vs Present Geographical
Distribution of Lions,”Brilliant Maps,April
26,2016,http:brilliantmaps.comdistribution-of-lions;Wikipedia,s.v.“Irvingia
gabonensis,”accessed February 11,2018,https:en.wikipedia.org
wikiIrvingia_gabonensis.
It is less likely that lions would have been in a rainforest,since they
typically inhabit grasslands and savannas.But perhaps the imaginary scenarios
described here took place near the edge of a rainforest or involved unusual lions
who liked rainforests.See Wikipedia,s.v.“lion”;Jeremy Hance,“King of theJungle:Lions Discovered in Rainforests,”Mongabay,August
13,2012,https:news.mongabay .com201208king-of-the-jungle-lions-discovered-in-
rainfore sts.
9. Harari,Sapiens,36.
10. Ibid.,20-21.
11. Large animals are defined as species weighing 100 pounds or more.See detailed
reference in Harari,Sapiens,65n2.
Recent research suggests that humans may have been in Australia for 5,000 to
18,000 years before the megafauna went extinct,but humans are still prime suspects
in their death.See Nicholas St.Fleur,“Humans First Arrived in Australia 65,000
Years Ago,Study Suggests,”New York Times,July
19,2017,https:www.nytimes.com20170719sciencehumans-reached-australia -
aboriginal-65000-years.html.
12. For population estimates used here and in the rest of this section,see Max
Rosner and Esteban Ortiz-Ospina,“World Population Growth,”Our World in Data,April
2017,https:ourworldindata.orgworld-population-growth.
13. Lingling Wei,“China’s Response to Stock Rout Exposes Regulatory Disarray,”Wall
Street Journal,August 4,2015,http:www.wsj.comarticleschinas-response-to-stock-
rout-exposes-regulatory-disarray-1438670061;Keith Bradsher and Chris
Buckley,“China’s Market Rout Is a Double Threat,”New York Times,July
5,2015,http:www.nytimes.com20150706business internationalchinas-market-rout-
is-a-double-threat.html.
14. Peter Russell,The Global Brain:Speculations on the Evolutionary Leap to
Planetary Consciousness(Los Angeles:J.P.Tarcher,1983);Howard Bloom,Global Brain:The
Evolution of Mass Mind from the Big Bang to the 21st Century(New
York:Wiley,2000);Abraham Bernstein,Mark Klein,and Thomas W.Malone,“Programming the
Global Brain,”Communications of the ACM 55,no.5(May 2012):41-
43,doi:10.11452160718.2160731.第一部分
什么是超级思维?第1章
如果你在街上看到它,你能认出超级思维吗?
1776年,亚当·斯密在《国富论》中写道,在市场中谋取自身利益最大化的买方
和卖方,往往也会由市场中的“一只看不见的手”引领,去谋取社会利益的最大
化。例如,你有一辆冰激凌车,假如卖芥末味的冰激凌比卖摩卡味冰激凌能让你获
取更多的利润,那么你的生意也会为社会贡献更多的经济价值。
当然,在某些情况下,谋求个人利益最大化并不意味着社会利益的最大化。不
过,亚当·斯密深刻地意识到,市场中的人际互动常能带来任何个体都无法实现的良
好的总体结果。即使你卖芥末味的冰激凌只是为了赚更多钱,但你也在不经意间通
过使用整个社会的牛奶、食糖、劳动力和其他资源而让更多人感到快乐。亚当·斯密
把市场的这种近乎神秘的属性称作“看不见的手”。
然而,市场不仅有看不见的手,还有看不见的思维。事实上,市场就是超级思
维。尽管超级思维无时无刻不在我们身边,但要看到它们,你必须知道如何看。一
些超级思维,比如公司,通常很容易看出来,而其他超级思维,比如生态系统,则
很难看出来。
我有时会跟自己玩一个小游戏,那就是当我走在街上的时候,数数我能看到多
少超级思维。当我走出麻省理工学院的办公楼,然后左转走向肯德尔广场时,我可
能会看到一个施工队、一家银行、多个商店和餐馆,以及一条虽然拥挤但行人不会
撞到彼此的人行道。
尽管这些都是超级思维,但为了看到它们,我们需要以一种非常特别的方式去
看。为了做到这一点,我们需要了解超级思维的定义。下面这个定义将贯穿全书:
超级思维——以看似智能的方式共同行事的一群个体。
我们也可以把集体智能定义为任何超级思维都具有的一种属性:集体智能——以看似智能的方式共同行事的群体取得的结果。
由于超级思维定义中的每个词都很关键,所以让我们来逐个剖析一下。
一群……
要看到超级思维,我们先得发现一个群体,这通常很容易做到。例如,正在对
我办公室附近的一幢大楼进行改造的施工队,显然是一群人。我有时会去买火鸡三
明治的那家餐馆的店员,也是一群人。
然而,有些群体就不这么显而易见了。例如,走在人行道上的人们并不是一个
你平常会多加留意的群体,但当他们为了避免撞到彼此而(大多)无意识地闪躲
时,在这一刻他们就成了一种超级思维。
个体……
尽管定义说超级思维是由“个体”组成的,但并没有明确说明是哪种个体。这
意味着超级思维中的个体可能很小,也可能很大,而且,他们不仅包含思维,还有
受思维控制的实体和其他资源。
例如,我们可以说我所在社区中的星巴克咖啡店是一个超级思维,它包括店里
的所有员工,还有桌子、椅子、咖啡机和咖啡豆。或者,我们可以说整间咖啡店本
身是一种规模更大的超级思维——包含我所在社区中的所有咖啡商户的市场——中
的个体。或者在较低层面上,我们可以说星巴克的一位咖啡师是一种超级思维,其
个体包括咖啡师大脑中的所有神经元,没错儿,每个人的思维本身就是一种超级思
维。
共同行事……
那么,所有群体都是超级思维吗?不一定。只在其个体采取某种行动时,群体
才是超级思维。例如,你应该不会认为放在地上的咖啡杯组(4件套)是超级思维。
但只采取某种行动的群体也不一定是超级思维,个体还必须共同行事。换句话
说,他们的活动必须是有关联的。两个不同城市的两个不相干的人,即使在同一天
的早晨各自昏昏沉沉地煮着咖啡,也不可能是超级思维。不过,在一家星巴克咖啡店里为了满足顾客的所有需要而一起工作的两位咖啡师,则是超级思维。
这里有一点很重要:尽管个体的行动需要有关联,但一个超级思维中的个体无
须彼此合作或者目标一致。比如,一个名叫创新中心(InnoCentive)的网站,科
学家和技术专家可以在这里比拼破解像如何合成某种特定化合物这样的难题。虽然
解决问题者是相互竞争(没有合作)的关系,但他们的行动也是相关联的,因为他
们都在解决相同的问题。
以看似智能的方式……
最后,只有一群行动有关联的个体仍然不够。要成为超级思维,群体还必须做
看似智能的事情。在定义中,“看似”这个词可能会让你觉得惊讶,因为它听起来
有点儿优柔寡断。但它确实必不可少,因为从某种重要的意义上说,超级思维和美
一样,都是“情人眼里出西施”。
事实上,超级思维的所有元素(即智能、个体、群体、行动和关联)都必须由
观察者来识别。 而且,不同的观察者会用不同的方式来分析相同的情形。例如,你认为每一家星巴克咖啡店本身就是一个超级思维,而我认为每家店只是一个更大
的超级思维的一部分,尽管我们都是对的,但却会对形势产生不同的洞见。
观察者的作用在评判智能方面尤为重要,因为在某种程度上,这往往是一种主
观判断。例如,你评判某个实体是不是智能的,主要取决于你对这个实体试图实现
的目标的看法。当学生做多项选择的智力测验时,我们会假定他们正试图给出出题
人认为正确的答案。但我一下子就想起了我高中时代的一个女同学,她非常聪明但
也非常叛逆,她在做这类测验的时候,很可能会在选择题答题卡的圆圈里画上好看
的花朵图案。如果她真的这样做了,那么通常的测试评分法根本无法测量她的高智
商!
总之,为了评估一个实体的智能水平,观察者必须对这个实体的目标做出假
设。当评估一个群体的智能水平时,将对观察者而言重要的群体目标考虑在内往往
是有帮助的,即使群体中没有个体持有这样的目标。
例如,一座城市中的每辆冰激凌车车主都有各自不同的目标:他们中的大多数
人可能都想赚尽可能多的钱,同时希望拿到经营许可的竞争者少一点儿。如果你在
这座城市的公园管理部门工作,在决定该为多少辆冰激凌车颁发公园经营许可证时,你可能想对游客进行调查,了解他们是否认为自己能买到足够物美价廉的冰激
凌。对由公园里的所有冰激凌车组成的超级思维来说,这些调查是评估其总体智能
水平的一种方法。
最后,需要注意的是,如果我们观察到某个群体试图做智能的事情,即便没有
成功,我们也可以把这个群体视为超级思维。例如,有一家初创软件公司,即使整
个团队竭尽所能,它的产品还是失败了,公司因此倒闭,你也可以把它看作超级思
维。
什么是智能?
那么,我们在前文中提到的智能究竟是什么意思呢?这个术语可以说是出了名
地难把握,不同的人以不同的方式来定义它。 例如,《不列颠百科全书》
(Encydopaedia Britannica)给它的定义是:“有效适应环境的能力。”认知心
理学家霍华德·加德纳(Howard Gardner)把它定义为“解决问题或者创造产品的
能力,而且这些问题和产品在一种或多种文化背景下都受到重视”。此外,一个由
52位知名心理学家组成的团队将该领域内的主流观点总结如下:
智能是一种非常普遍的心理能力,除了其他因素之外,还包括推理、规划、解决问题、抽象思考、理解复杂观点、快速学习和汲取经验的能力。它不只是表
现书本学习、狭义的学术技能和智能测试。更确切地说,智能反映了我们对周遭
环境的一种更广泛与深层次的理解能力,即对事物的“认知”、“了解”,或
者“明白”自己该做什么。
根据本书的主旨,我们将给出两种关于智能的定义,它们各自适用的情况也是
不同的。第一种是专业智能:
专业智能——在给定环境中有效地实现特定目标的能力。
这个定义与上文中提到的《不列颠百科全书》及霍华德·加德纳给出的定义是等
价的。总的来说,它的意思是一个智能实体会根据自己知道的一切,去做任何最有
可能帮助其实现目标的事情。说得更直白一点儿,专业智能就是实现特定目标
的“效能”。从这个意义上说,专业的集体智能就是“团队效能”,超级思维就是一个有效能的团队。
我们要介绍的第二种智能的应用更广泛,往往也更有趣:
通用智能——在不同的环境中有效实现各种不同目标的能力。
这个定义与前文中提到的52位心理学家给出的定义相似,而且智力测验衡量的
就是这种智能,而不只是评估你有效完成一些特定任务的能力。事实上,测验中的
这些任务都是精心挑选的,以便对你完成测验之外的很多其他任务的能力进行预
测。
比如,在智力测验中得分高的人通常比其他人更擅长阅读、写作、算术和解决
许多其他类型的问题。当然,一个长期从事某项特定工作——比如修理本田汽车
——的人,很可能要比一个更聪明却从未打开本田汽车引擎盖的人更擅长修车。但
是,更聪明的人往往也更善于快速学习新事物和适应新环境。
在下一章中,我们将会看到更多有关这个定义的内容,但这里有一个关键点,那就是通用智能的定义要求智能行为体不仅擅长完成某项特定任务,还善于学习如
何完成各项不同的任务。简单地说,这个定义与“多样性”或者“适应性”的意思
大致相同。那么从这个角度说,一般的集体智能就是“团队多样性”或者“团队适
应性”。
专业智能与通用智能之间的差异,有助于我们辨别现在的计算机与人在能力方
面的差异。在专业智能方面,目前的一些人工智能计算机比人要聪明得多。比如,在执行像下棋或玩Jeopardy(危险边缘)益智问答游戏这样的具体任务时,计算机
就比人的表现好。但是,不管它们多么擅长完成这些特定的任务,目前计算机的通
用智能水平都远不及任何一个5岁的正常人。比如,现在没有一台计算机能像一个普
通的5岁孩子那样顺畅地谈论问题,更不用说这个孩子还会走路、捡起奇形怪状的物
体,以及看出别人是否开心、难过或生气。
所以,当我走在办公室附近的街道上(或者其他任何地方)时,会看到很多超
级思维。要想识别它们,我需要确认4个要素:第一,一群个体;第二,这些个体正
在采取某些行为;第三,这些行为之间存在的某种相互联系;第四,我们评估这些
行为时的参照目标。每当我看到这4个要素组合在一起时,我就能找到一个超级思维。不过有一点很
重要,那就是识别超级思维的过程有时很有用,有时则不然。比如,我可能会说办
公桌的4条腿构成了一个群体,共同防止桌面掉落到地上。就其本身而言,这句话并
没有错,而且从这个角度看,我的桌子就是一种极其简单的超级思维。但是,把超
级思维的概念以这种方式应用于我的桌子或许效用很小,因为我们并不能从中获得
一点儿有关如何使用桌子或做其他任何事情的新见解。
正如物理学家需要学习如何巧妙地运用像力、质量和能这样的概念,去有效地
认识真实的物理情景一样,我们也需要学习如何巧妙地运用超级思维和集体智能的
概念,去真正理解现实世界。
1. Kenneth J.Arrow and Gérard Debreu,“Existence of an Equilibrium for a Competitive
Economy,”Econometrica 22,no.3(1954):265-90,doi:10.23071907353.
2. The basic concept of supermind used here is a generalization of the concept
of“corporate entity”as defined by Benjamin Kuipers in“An Existing,Ecologically-
Successful Genus of Collectively Intelligent Artificial Creatures,”presented at the
Collective Intelligence Conference,MIT,Cambridge,MA,April
2012,https:arxiv.orgpdf1204.4116.pdf.
The detailed definition of a supermind is based on the definition of collective
intelligence in Thomas W.Malone and Michael S.Bernstein,Handbook of Collective
Intelligence(Cambridge,MA:MIT Press,2015),1-13.
Of course,this is not the only way to define collective intelligence,and many
authors have defined it in other ways.A sample of other definitions and a history of
how the term has been used previously is also included in Malone and
Bernstein,Handbook,10.
Starr Roxanne Hiltz and Murray Turoff,for example,define collective intelligence
as“a collective decision capability[that is]at least as good as or better than any
single member of the group.”See Hiltz and Turoff,The Network Nation:Human
Communication via Computer(Reading,MA:Addison-Wesley,1978).
John B.Smith defines it as“a group of human beings[carrying]out a task as if the
group,itself,were a coherent,intelligent organism working with one mind,rather than
a collection of independent agents.”See Smith,Collective Intelligence in Computer-
Based Collaboration(Hillsdale,NJ:Lawrence Erlbaum,1994).
Pierre Levy defines it as“a form of universally distributed
intelligence,constantly enhanced,coordinated in real time,and resulting in the
effective mobilization of skills.”See Levy,L’intelligence collective:Pour uneantbropologie du cyberspace(Paris:Editions La Decouverte,1994).Translated by Robert
Bononno as Collective Intelligence:Mankind’s Emerging World in
Cyberspace(Cambridge,MA:Perseus Books,1997).
And Douglas Engelbart defines the closely related term collective IQ as a
community’s“capability for dealing with complex,urgent problems.”See
Engelbart,“Augmenting Society’s Collective IQ,”presented at the Association of
Computing Machinery Conference on Hypertext and Hypermedia,Santa Cruz,CA,August
2004,doi:10.11451012807.1012809.
Each of these definitions provides useful insights,but as we’ll see,the broader
definition used here allows us to derive insights by comparing and contrasting very
different forms of collective intelligence.
3. We are taking here a pragmatic view in two different philosophical senses:the
pragmatic view of scientific theories and the philosophical tradition of
pragmatism.See Rasmus Gronfeldt Winther,“The Structure of Scientific Theories,”in
Stanford Encyclopedia of Philosophy(Winter 2016 edition),ed.Edward
N.Zalta(Stanford,CA:Stanford
University,2016),https:plato.stanford.eduarchiveswin2016entriesstructure-
scientific-theories; Christopher Hookway,“Pragmatism,”in The Stanford
Encyclopedia of
Philosophy,https:plato.stanford.eduarchivessum2016entriespragmatism.
In other words,we are saying that a scientific theory(such as our theory of
superminds) includes how the theory is interpreted in practice and whether these
interpretations are useful.
This means,from our point of view,that it doesn’t really make sense to ask
whether a supermind exists.What matters is whether a particular interpretation of
the world that includes that supermind is useful.One could similarly say that
theoretical concepts in physics(like force and energy) and in economics(like supply
and demand) exist only in the context of how they are interpreted by observers in
particular situations and how useful those interpretations are.
4. Encyclopedia Britannica,s.v.“intelligence”(cited by Shane Legg and Marcus
Hutter,“A Collection of Definitions of Intelligence,”technical report no.IDSIA-07-
07,IDSIA,Manno,Switzerland,2007,https:arxiv.orgpdf0706.3639.pdf);Howard
Gardner,Frames of Mind:Theory of Multiple Intelligences(New York:Basic Books,1983).
5. Linda S.Gottfredson,“Mainstream Science on Intelligence:An Editorial with 52
Signatories,History,and Bibliography,”Intelligence 24,no.1(1997):13-23.第2章
群体也能做智力测验吗?
或许自有人类以来,有些人看起来就要比其他人更聪明,他们能更迅速地解决
问题,知道的更多,学东西也更快。然而,在20世纪初,心理学家开发出一种旨在
客观衡量与我们所谓的智能类似的某种特质的方法,从而让我们对这种现象有了突
破性认识。
面对群体,我们可以采取同样的方法吗?我们能客观地衡量一个群体(或超级
思维)有多聪明吗?如果可以,那么我们能客观地说某些群体比其他群体更聪明
吗?有没有什么科学依据能帮助我们判断一个群体是否“智能”呢?根据我和我的
同事最近做的研究,我们现在已经知道上述所有问题的答案都是肯定的。但为了理
解其背后的原因,我们先要对个体智能及其测验方式有更多的了解。
测量个体智能
让智力测验成为可能的最关键进展,就是发现了一个有关人类能力的惊人事
实。假设你知道约翰擅长数学,而苏擅长阅读,那么你会怎样猜测他们另一科目的
表现呢?如果你和多数人一样,那么你可能会认为约翰的阅读水平是中等或中等偏
下,而苏的数学课业的表现亦如此。根据我们的日常经验,这样的推测似乎常常是
正确的。
然而,现在我们从数百项科学研究中了解到的惊人事实是:在通常情况下,擅
长某种脑力任务的人也擅长其他大多数脑力任务。 那些擅长阅读的人在数学方面
的表现往往也是中上等的,反之亦然。除了很多其他特点之外,那些擅长数学和阅
读的人的记忆力通常也很好,知道更多有关这个世界的常识,而且更善于逻辑推
理。 当然,不排除有些人会在某些领域比其他人更充分地提升自身技能,而有些
人则在通用智能(即完成各项不同的脑力任务的能力)方面比其他人更胜一筹。
一种更科学的表述方式是:如果你让很多人去执行很多项不同的脑力任务,并用统计学方法分析结果,就会发现他们在每项任务上的得分与他们在其他大多数任
务上的得分存在正相关关系。
有了这个数据集,你就可以利用一种叫作因子分析的统计方法,确定不同分数
相关性的基础结构。例如,如果你想通过这种方法来分析人们的政治态度,你可以
问他们关于很多问题(比如,堕胎、税收、同性恋婚姻和全民医疗保险等)的看
法。分析结果会告诉你,受访者给出的大多数答案是源于单一基础维度(比如,自
由派与保守派),还是多个维度(比如,关于社会和经济问题的看法)。
当心理学家用这种方法分析人们在不同脑力任务上的得分时,他们通常会发现
人们的各项任务表现是不同的,并且通过一个单一的统计因子就能预测出其中
30%~60%的差异。除此之外,没有一个因子的预测结果能超过上述范围的12。 这
种统计方法基于该因子为每个个体算出一个分数,得分高的人在大多数任务方面的
表现都比得分低的人好。这个统计因子与我们直觉上所谓的智能相对应,而且现代
的所有智力测验在设计时都会包含用于衡量这一因子的任务。
重要的是,我们必须意识到这个结果不是预先决定的。对于人的其他特征,比
如个性,并不存在能够预测其他表现的单一因子。例如,即使你知道一个人很内
向,也无法据此预测他是一个一丝不苟还是讨人喜欢的人。 但事实表明,不同的
人在完成脑力任务方面的通用智能水平存在差异,这是一个公认的科学事实。
当然,这个结果不仅在科学研究方面引人注目,也有显著的实用价值。通过任
何一项标准的智力测验,你都可以预测出一个人在很多其他任务方面的表现如何,而无须花几个月或几年的时间去逐一观察。例如,如果你想预测一个人的学习成
绩,或者他的各项工作表现,仅通过一个简短的纸笔智力测验的结果,你就能得出
相当准确的结论。 甚至从统计学上讲,更聪明的人寿命也更长。以某项客观的衡
量为基础对人生的这些重要结果进行预测,能产生很多非常重要的实用结论,其中
就包括价值数十亿美元的教育考试行业的发展,其用到的测试与智力测验十分相
似。
不过请务必记住一点:在预测一个人未来的一切时,这些智力测验远非灵丹妙
药。有很多其他的重要能力是无法通过标准的智力测验来测量的。例如,霍华德·加
德纳就将音乐能力、身体能力和人际交往能力归为不同种类的智能。 除了智能以
外,影响你的学校和生活表现的因素还有很多,包括(这里不一一列举)你的努力程度,你从家人和朋友那里得到的帮助,(当然)还有你的运气。
有些人已经对我们过度依赖标准智力测验和其他测试的现象提出了批评,这是
对的。美国学术能力评估测试(SAT)和其他类似的教育考试尽管不是被有意设计为
智力测验,但其结果却与那些智力测验的结果高度相关。不过,问题并不在于考试
没有价值,而在于我们有时会对它们期望过高。我们对考试预测作用的预期往往超
出了实际情况,而且过分强调考试对素质的衡量作用,致使我们对其他重要的方面
不够重视。
但是,我们也不应该忽略一个事实,那就是在预测人们是否擅长做我们认为重
要的事情时,智力测验通常是唯一的最佳方式。例如,在一项十分全面的研究中,智力测验对人们能否求职成功的预测是最准确的,其准确度甚至超过了实习经历、背景调查、面试表现和学业成绩。 所以,尽管智力测验并不是预测所有人生结果
的最佳方式,但个体智力测验的发展可以说是20世纪心理学领域的最重要成果之
一。
群体智力测验
那么,所有这些关于个体智能的结果对集体智能来说,又意味着什么呢?群体
能像个体一样智能吗?有没有什么能判断某些群体比其他群体更聪明的客观方法?
换句话说,对一个群体而言,有没有一个单一的统计因子就像个体智力测验那样,可以对群体在很多项不同任务上的表现进行预测?
就我和我的同事已知的情况而言,从未有人问过这个显而易见的问题,于是,我们决定寻找它的答案。我的同事安妮塔·伍利(Anita Woolley)在整项研究工作
中发挥了关键作用,并且是我们报告原始结果的那篇论文的第一作者。 克里斯托
弗·查布里斯(Christopher Chabris)等人也参与了其中的部分工作。
要想创造出一项针对群体的智力测验,我们需要做的第一件事就是挑选出一组
适合群体完成的任务。我们原本可以直接要求群体一起回答标准的个体智力测验的
相关问题,然而,其中虽然包含各种各样的脑力任务,但不一定有很多需要群体合
作才能完成的任务。所以,我们利用社会心理学家约瑟夫·麦格拉斯(Joseph
McGrath)为对团队任务进行分类而创立的一个著名的框架, 并从该框架的主要类别——提出、选择、协商和执行——中分别挑选任务。
例如,对于提出新想法的任务,我们要求各个小组就一块砖的用途开展头脑风
暴。对于在指定选项中进行选择的任务,我们要求各个小组解决来自一项名为“雷
文标准推理测验”的图形谜题。对于协商的任务,我们让小组成员假装他们都生活
在同一屋檐下,并规划一次购物之旅,相关限制因素包括出行时间、费用和他们需
要购买商品的易腐烂性。最后,对于执行的任务,我们要求他们把一个长文本段落
输入共享的在线文本编辑系统。我们还要求他们执行单词补全、空间谜题和估计问
题等任务。总的来说,这些任务代表了群体在现实生活中可能要完成的各项任务。
接下来,我们需要做的就是招募接受测验的小组。邀请在校大学生参与是比较
容易的,由于我们的研究是在麻省理工学院和卡内基–梅隆大学进行的,完全可以找
身边的大学生来帮忙。但我们认为,如果所有的测试对象都是高智商、成绩优异的
大学生,得到的测试结果或许会有偏差,对一项集体智能研究来说尤其如此。所
以,为了使参与测验的小组能代表社会的各个阶层,我们通过多种渠道(包括公共
网站)在多个城市的普通公众中招募测试对象。在对他们进行了简短的个体智力测
验后,我们发现他们的智力分布与美国人口的总体智商分布情况非常相似。
在我们最初的两项研究中,699位测试对象被分成192个小组,每个小组有2~5
个人。与企业和其他组织中的大多数团队不同,我们的小组中没有指定的领导者,选人也不以任何专长为依据。但不管在什么情况下,各个小组都要作为整体而非个
体去共同完成所给的任务。
这样的测验有用吗?
我们给了各个小组一次完成所有任务的机会,然后分析他们之间的相关性。在
我们的研究中,这是悬念最大的关键时刻。会不会像在个体智力测验中那样,存在
某个能解释群体的各项任务表现的单一因子呢?或者是否存在某个更复杂的因子结
构,例如,一些群体擅长数学任务,而另一些擅长文字任务?
答案是:群体就像个体一样。事实上,的确存在一个针对群体的单一统计因
子,而且它可以预测出这个群体在多项任务上的表现如何。我们在上文中已经提
到,针对个体的统计因子能预测出个体在不同任务上的表现的30%~60%的差异。在我们的研究中,对于群体,这个比例大致处于上述范围的中间,即45%。由于该因子
在个体智力测验中被称为智能,所以我们把与群体对应的新因子称为集体智能。
也就是说,我们发现群体和个体一样,具有某种形式的通用智能。这意味着我
们或许可以像利用个体智能那样,利用集体智能更多地了解是什么让群体有效完成
了各种各样的任务。
开启这个过程之前,我们针对最初研究进行了一次检验,目的是看看我们测量
的集体智能因子能否预测出群体在其他任务上的表现。为此,我们也给各个小组布
置了一些需要综合运用各种能力的更复杂的任务。例如,在一项研究中,小组和计
算机进行了一场跳棋比赛。在另一项研究中,他们用积木搭建了一系列符合规则要
求的结构。
我们发现,集体智能测试分数确实可以对群体在这些更复杂任务上的表现进行
显著有效的预测。事实上,在这些更复杂任务的表现预测方面,一个群体的集体智
能分数的效果比群体成员的个体智能分数的平均值或最大值都好。
什么能让群体变聪明?
在做研究之前,我们认为要寻找的与群体对应的单一集体智能因子,很可能要
通过群体成员的平均个体智能进行预测,也就是说,成员越聪明,群体就越聪明。
然而,我们的研究发现要有趣得多。
尽管我们的确找到了群体成员的平均及最大智能与群体的集体智能之间的相关
性,但它只是中等强度。换句话说,只是把一群聪明人聚集起来,并不能保证你会
拥有一个聪明的团队。或许你已经从自身经验中猜到这一点了,毕竟我们中的大多
数人都见过由聪明人组成的团队最后却一事无成的例子。但是,如果拥有一群聪明
人都不足以让该团队变聪明,什么才能做到这一点呢?
我们对前人研究中提到的有可能对团队有效性做出预测的多种因素进行了检
验,比如,成员对所在团队的满意程度,他们帮助团队取得优异表现的积极程度,以及他们在团队中的舒适感。结果发现,这些因素中没有一个与团队的集体智能水
平显著相关。不过,我们确实找到了三个显著因素。第一个是群体成员的平均社会洞察力。
我们运用“眼神读心”测试对这个因素进行测量,在测试过程中,人们通过看其他
人的眼睛照片,试着猜测照片中的人的心理状态(见下图)。 这个测试最初是用
来测量孤独症的(患有孤独症及相关病症的人的测试表现非常糟糕),但事实证
明,即使在“正常”的成人当中,不同的人在完成这项任务的能力上也存在显著的
差异。
你可能会说这个测试是对一个人的社会智能的测量,而且我们发现,如果这些
群体中有很多成员在这方面的表现突出,那么它们的集体智能水平通常要比其他群
体高。
我们发现的第二个重要因素是,群体成员能够大致平等地参与对话的程度。当
对话被一两个人主导时,平均而言,群体的智能水平要比参与度分布更均匀的时候
低。
最后,我们发现群体的集体智能与其女性成员的比例显著相关。女性占比更高
的群体也更聪明,这个结果基本上可以通过社会洞察力的测量并从统计学的角度来
解释。
在着手进行集体智能研究之前,我们就已经知道,女性的社会洞察力测试平均
分比男性要高。所以,关于我们的发现的一种可能的解释是,一个群体的集体智能
与其成员的社会洞察力有关,而非他们的性别。换句话说,如果一个群体中社会洞
察力强的人足够多,那么不管这些人是男是女,都足以让这个群体变聪明。但如果
你要挑选团队成员,而且只知道候选者的性别,而对其他情况一无所知,那么你在
女性身上发现社会洞察力的概率可能略高于男性。有趣的是,我们的研究结果与人们关于群体多样性的典型设想并不相符。大多
数人都会认为,男女比例差不多各占一半的群体应当是最聪明的。但在我们的数据
中,男女人数相等的小组位于智能水平最低的行列。如下图所示,我们的数据表明
群体的集体智能也许会随着女性比例的增加而不断提高。
还有一点很重要,就是意识到由于图中的点并不是线性分布的,所以在数据中
可能存在有相当数量的“噪声”(例如,从数据点延伸出去的垂直线表示的是统计
学家所谓的标准误差)。我们期待未来的研究能进一步阐明噪声背后的复杂原因。
不过,我们的研究结果至少已经给出了一些关于群体中男性与女性在集体智能上可
能起到的决定性作用的有趣看法。
社会智能是集体智能的关键因素在探究群体表现差异的过程中,我们从一个事实中获得了重要线索,那就是当
试图同时利用上述三个因素(即社会洞察力、发言机会的分配和女性成员比例)对
集体智能进行预测时,我们发现真正具有统计显著性的因素只有社会洞察力。这并
不意味着其他两个因素不重要,而只是表明在它们之下发挥作用的基本机制可能就
是社会洞察力。例如,我们在上文中提到,社会洞察力有可能产生了性别效应,而
且社会洞察力强的人或许更有可能得到发言机会。
后来,我们对在线小组进行的一项研究,充分证明了社会洞察力因素的强大力
量。在该研究中,我们随机地把测试对象分成两组。 面对面小组围坐在一张桌子
旁,一边相互交谈,一边在笔记本电脑上完成某个版本的集体智能测验。尽管在线
小组接受的是相同的测验,但他们完全看不到彼此,只能通过输入文字信息进行相
互交流。我们发现在这两个小组中,成员的社会洞察力对集体智能水平的预测效果
同样好。换句话说,善于从其他人的眼睛中读取情绪的人也善于团队合作,甚至是
在线沟通,而且根本看不到彼此眼睛的情况下!
这表明社会洞察力肯定与更广泛的人际交往能力相关,而且这些能力对在线交
流和面对面交流同样有效。例如,让你读懂他人脸上情绪的那种社会智能或许也能
帮助你根据他人输入的文字猜出他们的感受,并帮助你预测他们会对你可能回复的
各种内容做何反应。
也就是说,在面对面的世界里至关重要的社交能力和社会智能,在未来日益增
强的网络世界中同样重要甚至更重要。
认知多样性也很重要
在另一项研究中, 我们关注的是认知方式的多样性,即人们对世界的习惯性
看法的差异。根据前人对这个问题的研究,我们重点考虑三种不同认知风格的人:
言语型认知者、对象表象型认知者和空间表象型认知者。 言语型认知者善于用文
字进行推理,对象表象型认知者善于掌握图像(比如油画)的整体特征,空间表象
型认知者则善于对图像的各个部分逐一进行分析(就像对建筑蓝图那样)。大致来
说,这三种认知风格分别对应于人文、视觉艺术和工程学专业的学生。
当用这些认知风格的各种组合来分析群体的集体智能时,我们发现集体智能水平最高的群体拥有中等水平的认知多样性。换句话说,成员间认知风格差异很大的
群体,其智能水平并不高,这可能是因为他们彼此无法有效地交流。所有成员的认
知风格完全一致的群体,其智能水平也不高,这可能是因为他们不具备完成不同任
务所需的各项技能。最佳组合似乎是拥有中等水平多样性的群体,这可能是因为其
既有足以保证有效沟通的共性,又有足以解决一系列不同问题的多样性。
集体智能水平高的群体学习速度更快吗?
个体智能最重要的特征之一是,它不仅能预测人们可以做到的事情,还能预测
他们学习新事物的速度。集体智能也是这样吗?一个群体的集体智能水平可以预测
这个群体的学习速度吗?
回答这个问题的第一步是,我们在最初的研究中给一些完成了集体智能测验的
小组布置了另一项任务。我们要求他们玩一个被开发者称为“最小努力隐性协调博
弈”的游戏。 在这个游戏的每一轮,每位玩家都必须从5个数字中选择一个,他赢
得的点数取决于他自己选择的数字和其他小组成员选择的数字。为了帮助他们做出
选择,玩家每次都可以查看“支付矩阵”(见下表),根据他们自己选择的数字和
其他小组成员选择的最小数字,计算赢得的点数。
最小努力隐性协调博弈和著名的囚徒困境博弈有点儿像,都要求玩家同时且独
立地完成每一轮。他们不能把自己选择的数字告诉别人,唯一可能的协调方式就是
观察小组的其他成员在前几轮的选择。不过,与囚徒困境不同的是,这个游戏会让
合作的玩家而非竞争的玩家获得丰厚的回报。如果在全部10轮游戏当中,所有玩家
都做出了同样的选择(即数字40),那么他们每个人的收益都能实现最大化。但这
个选择是有风险的,因为如果你选择了40,而小组中的其他人选择了0,你就会失
分。如果你选择了除40以外的任何数字,那么不管其他小组成员如何选择,你都不
会失分。大多数小组在玩这个游戏的时候,前几轮的表现都不太好,但我们发现在全部
10轮游戏中,集体智能水平高的团队能更快地学会如何根据他们在前几轮的表现,暗中相互配合,他们的总分也因此显著高于其他团队。至少从这个角度看,正如我
们期望的那样,集体智能水平更高的群体,学习速度也更快。
集体智能还能预测什么?
在另外几项研究中,我们把集体智能测验题翻译成德语和日语,并对在美国、德国和日本以各自的母语接受测验的小组进行了研究。我们的发现进一步证实了我
们最初的结论,那就是在这三个国家的各种群体交流模式(面对面、语音、视频和
文本)中,都出现了与我们最初的研究相同种类的集体智能因素。
我们还发现,集体智能测验的分数能预测学生团队在某个课题项目上的表现,以及实验室团队在“假设你们迫降在沙漠中,请挑选出最重要的生存物品”这项任
务中的表现。
一个更加重要的问题可能是对于那些结果与现实世界密切相关的任务,集体智
能能否预测群体在其中的表现如何,而不只局限于实验室或者教室。作为解决这个
问题的第一步,我们在电子游戏世界里发现了一些非常有趣的结果。我们对全世界
最受欢迎的在线电子游戏之一——《英雄联盟》中的团队进行了研究。在这个游戏
中,玩家通常会5个人组成一个团队,相互协作去攻占对手团队的基地,杀死怪物,同时迎接沿途遇到的其他挑战。尽管这是一个虚拟的作战环境,但团队成员必须紧密合作,就像身处真实的战斗场景中一样。
这些团队中有很多都是由长时间在一起玩的玩家组成的,游戏会根据这些团队
的比赛表现给他们排名,类似于国际象棋选手排行榜。
在这款游戏的开发商拳头公司的配合下,有超过200个团队接受了我们的在线集
体智能测验。我们发现,正如我们期望的那样,团队的集体智能得分对他们在游戏
中的表现有着显著的预测作用,而且相当持久,不仅体现在他们接受测验的时候,还体现在6个月以后。 所以,就像个体智能可以预测个体在现实世界中的各种表现
一样,集体智能也可以对群体在现实世界中的表现做出预测。
测量集体智能
在继续下面的讨论之前,我们有必要暂停一下,对已经了解的情况进行回顾。
上述所有研究结果为以下结论奠定了坚实的基础:
1. 人类群体拥有一种集体智能,集体智能与通过个体智力测验来测量
的个体智能相似。
2. 这种集体智能就是我们在第1章中谈到的通用智能,即在多种不同
的任务中都有出色表现的能力。
3. 这种集体智能会受到下列因素的影响:
群体成员的个体智能;
群体成员与他人良好协作的能力(通过他们的社会洞察力来测量);
群体成员的认知多样性。
4. 我和我的同事为了测量这种集体智能而开发的测验,能够预测群体
在下列方面的表现:
执行实验室、课堂和在线游戏中的各项任务;? 利用面对面和在线沟通方式;
跨语言和文化交流。
这些结论引出了一些关于如何应用集体智能测验的有趣问题。我们能不能通过
让某个销售团队参与一次简短的测验(就像我们在研究中用到的那种),预测他们
在今后几个月内的工作表现呢?通过高层管理团队或者董事会的测验得分,可以预
测出他们在面对挑战时会有怎样的表现吗?尽管我们还不能确定这些问题的答案,但我们希望答案是肯定的。
另一个有可能被提出的有趣问题与提高某个群体的集体智能,并使之成为一个
智能水平更高的超级思维有关。我们知道个体智能在一个人年轻的时候就基本定型
了,但提升一个群体的智能水平似乎是大有可能的,比如通过替换足够多的成员。
在本书后面的章节中,我们还会看到其他提升群体智能水平的方法。
我们还能用什么方法测量集体智能?
虽然我和我的同事为了系统衡量一个群体的智能水平而设计的方法,带来了令
人满意的结果,但这种方法也有其局限性。比如,这项测验针对的是较小的群体。
在我写作本书的时候,我们正在利用某个版本的测验对多达40人的群体进行研究,而且我们很想知道这种方法至多能对多大规模的群体进行测试。不过我们认为,当
群体规模足够大的时候,就有必要使用其他一些方法了。
从更基本的层面上说,为了利用我们设计的测试方法,我们必须干预一个群
体,并让其成员做一件他们原本不会做的事情,即接受测试。对现实生活中的很多
群体(比如大型企业、市场)来说,要说服群体的每个成员花时间去完成一项哪怕
只需要几分钟的特殊测验,也非常困难。如果我们可以仅通过观察某个群体在一般
情况下的做事方法,并利用观察结果来准确估计群体的智能水平,就再好不过了。
幸运的是,不管是干预还是观察,都有很多种测量群体的集体智能的方法,而
且其原理都是我们在第1章提到的智能的两种定义中的一种。
你能通过观察了解很多东西有一种衡量群体专业智能的方法是选择一个目标,然后观察某个群体实现这一
目标的情况。比如,你可以用像利润、生产率和投资回报率这样的指标,衡量一家
企业的财务目标实现状况。或者你可以用过去5年内新产品的营收占比(产品创新度
的衡量标准)、创造的就业机会、员工对工作场所的满意程度,以及其他企业的高
管向它表示钦佩的频次等指标,来评估一家企业在其他方面的表现。
你可以通过像国内生产总值(GDP)这样的经济指标,或者像犯罪率、识字率和
生活质量概况这样的社会指标来衡量整个社会的表现。如果想衡量市场的表现,你
可以利用市场流动性、不稳定程度和根据新信息调整价格的速度等指标。
在某些情况下,你还可以通过观察对某个群体的集体通用智能进行了解。要做
到这一点,你需要在足够多的不同场合下观察群体的行为,从而评估群体的灵活性
或者适应性。
例如,尽管我们通常认为发明家托马斯·爱迪生是一位天才,但从某种重要的意
义上说,他参与创立的通用电气公司作为一个组织似乎更具有天才的特质。在1896
年入选道·琼斯工业平均指数的原始成分股中,通用电气是唯一一家至今 仍被留在
指数中的企业。 一个多世纪以来,为了在许多不同的行业和多种经济环境下生存
发展,通用电气必须具备极强的灵活性和适应性。当然,这也很可能得益于好运气
和其他因素,但我们完全有理由认为通用电气拥有高水平的集体通用智能。
近年来,苹果公司至少彻底改变了三大行业:个人计算机、音乐和移动电话。
很多人都会把苹果公司取得的大部分成就归功于一个人——史蒂夫·乔布斯,但从乔
布斯去世到现在,苹果公司仍在持续发展。公正地说,不管苹果公司在这些行业中
取得成功的原因是什么,我都认为它表现出卓越的集体通用智能。
经济学家已经发现,在通常情况下,公司的业绩大多会表现出惊人的持久性,也就是说,业绩表现好的公司往往能保持住成功,而业绩表现差的公司则往往只会
在底部徘徊。 例如,一项针对美国制造工厂的研究发现,在1972年生产率排行前
50名的工厂中,5年和10年后仍保持在前50名行列的工厂占比分别为61%和42%。而
在生产率垫底的工厂中,10年后仍保持在后50名的工厂占比为38%。 所有涉及管
理和经济的领域都在试图探索造成这些差异的原因,但业绩随时间推移表现出的这
种稳定性表明,在这些工厂中某种集体智能的水平是参差不齐的。
除了在很长一段时间内衡量同一个变量之外,我们还可以通过同时观察多个不同变量来评估通用智能。例如,不丹非常关注所谓的国民幸福指数,这是综合考虑
各种指标(健康状况、生活标准、教育水平和内心幸福感)后对社会福利水平的一
种衡量。如果一个社会在所有这些方面都做得很好,我们就可以说这个社会比只在
一两个方面表现突出的社会的集体通用智能水平更高。
有时你必须做些什么
要想通过干预的方式衡量群体的集体智能,你需要先选出群体表现的几个方
面,再利用测试看看群体对你的行为做出的反应。在面对大型群体的时候,这种方
式往往很难实现,因为你要么需要说服群体的每个成员参与其中,要么需要足够的
资源去改变群体环境。
如果你有充足的资源,就可以通过将某个组织置于各种各样的情境中,对这个
组织的环境进行干预,比如,你可以建立一个与研究对象呈竞争之势的组织,或者
对研究对象需要的某些原材料开出非常优惠的价格。通过观察该组织在应对这些极
端情况时的表现,你肯定能了解到有关其智能水平的一些有趣信息。不过,像这样
的大规模实验当然是有限制条件的。
事实上,小规模干预也是有用的。例如,很多公司利用“神秘顾客”对在零售
商店、餐馆和电话客服中心直接面向公众的员工表现进行评估。神秘顾客会和其他
顾客一样,使用某个组织的服务,比如吃一个汉堡包、买衣服或者拨打电话求助热
线。被组织评估的员工会以为神秘顾客就是普通顾客,所以很可能像对待其他任何
顾客一样对待神秘顾客。不过,与普通顾客不同的是,这些神秘顾客会仔细留意并
报告他们接受服务的具体情况,并为此获得报酬。
当评估一个组织在实现目标(比如,及时问候和礼貌地服务顾客)方面的专业
智能时,神秘顾客通常是一种好办法。如果与神秘顾客的互动过程要求员工完成很
多不同种类的任务,这就有可能成为衡量该组织的集体通用智能的部分方法。
例如,你可以招募形形色色的神秘顾客,无论男女老少、是否受过良好的教
育、暴躁易怒还是彬彬有礼,并让他们拨打智能手机供应商的客服热线,咨询各种
各样的问题,比如硬件故障、软件故障和不了解产品等。如果有些公司的表现始终
很好,那么你可以说它们的客服业务表现出很高的集体智能水平;如果有些公司的
表现很差,那么你可以说它们欠缺集体智能。关于这些结果的统计分析能否帮我们找到一个单一因子,当群体面对所有类型
的问题时,该因子能对群体表现的巨大差异做出预测(类似于我们在小型工作团队
中的发现),这将是一个有趣的问题。即使真的找到了,我也不会对此感到惊讶。
所以,这一切意味着什么呢?我们现在知道,将智能的概念应用于群体并不只
是一种诗性隐喻。对于通用智能——在实现各种不同目标方面的良好表现——我们
已经看到,在统计学上,群体和个体都表现出智能的特质。专业智能——在完成某
个特定目标方面的良好表现——则提供了一种有效方法,可用于对很多不同团队在
实现单一目标方面的表现进行比较。
我们还获得了关于“是什么让某些群体比其他群体更聪明”这个问题的一些振
奋人心的线索,那就是只拥有聪明的个体是不够的。个体还需要进行有效合作。
1. The first person to document this was Charles Spearman,and it is arguably one of
the most replicated results in all of psychology.See Spearman,“‘General
Intelligence,’Objectively Determined and Measured,”American Journal of Psychology
15(1904):201-93.
2. Ian J.Deary,Looking Down on Human Intelligence:From Psychometrics to the
Brain(New York:Oxford University Press,2000).
3. Christopher Chabris,“Cognitive and Neurobiological Mechanisms of the Law of
General Intelligence,”in Integrating the Mind:Domain General Versus Domain Specific
Processes in Higher Cognition,ed.Maxwell J.Roberts(Hove,UK:Psychology
Press,2007),449-91;Earl Hunt,Human Intelligence(Cambridge,UK:Cambridge University
Press,2011),91ff.;Gilles E.Gignac,“The WAIS-III as a Nested Factors Model:A Useful
Alternative to the More Conventional Oblique and Higher-Order Mo dels,”Journal of
Individual Differences 27,no.2(2006):73-86.
4. Robert R.McCrae and Paul T.Costa,“Validation of the Five-Factor Model of
Personality Across Instruments and Observers,”Journal of Personality and Social
Psychology 52,no.1(1987):81-90;John M.Digman,“Personality Structure:Emergence of
the Five-Factor Model,”in Annual Review of Psychology 41,ed.Mark R.Rosenzweig and
Lyman W.Porter(Palo Alto,CA:Annual Reviews,Inc.,1990):417-40.
Some researchers have proposed that there may be a“general factor”for
personality,as there is for intelligence(e.g.,Janek Musek,“A General Factor of
Personality:Evidence for the Big One in the Five-Factor Model,”Journal of Research
in Personality 41,no.6 [2007]:1,213-33),but there is not yet a consensus in the
field that this is true.If there comes to be a general consensus that there is a
general personality factor,the point made in the main text is still valid:it’scertainly not preordained that there would be a general factor,either for
intelligence or for personality.
5. Deary,Looking Down on Human Intelligence,22-23.
6. Howard Gardner,Frames of Mind:Theory of Multiple Intelligences(New York:Basic
Books,1983);Howard Gardner,Multiple Intelligences:New Horizons(New York:Basic
Books,2006).
7. John E.Hunter and Ronda F.Hunter,“Validity and Utility of Alternative Predictors
of Job Performance,”Psychological Bulletin 96(1984):72-98.
8. Anita Williams Woolley,Christopher F.Chabris,Alex Pentland,Nada Hashmi,and
Thomas W.Malone,“Evidence for a Collective Intelligence Factor in the Performance
of Human Groups,”Science 330,no.6,004(October 29,2010):686-
88,http:science.sciencemag.orgcontent3306004686,doi:10.1126science.1193147.
9. Joseph Edward McGrath,Groups:Interaction and Performance(Englewood
Cliffs,NJ:Prentice Hall,1984).
10. Simon Baron-Cohen,Sally Wheelwright,Jacqueline J.Hill,Yogini Raste,and Ian
Plumb,“The ‘Reading the Mind in the Eyes’Test Revised Version:A Study with Normal
Adults,and Adults with Asperger Syndrome or High-Functioning Autism,”Journal of
Child Psychology and Psychiatry 42,no.2(2001):241-
51,doi:10.1017S0021963001006643;Simon Baron-Cohen,Therese Jolliffe,Catherine
Mortimore,and Mary Robertson,“Another Advanced Test of Theory of Mind:Evidence from
Very High Functioning Adults with Autism or Asperger Syndrome,”Journal of Child
Psychology and Psychiatry 38,no.7(1997):813-22.Figure reproduced with author’s
permission.
11. An adapted version of this figure was published in Anita Williams Woolley and
Thomas W.Malone,“Defend Your Research:What Makes a Team Smarter?More
Women,”Harvard Business Review 89,no.6(June 2011):32-33.
The collective intelligence scores are normalized with 0 as the average across
all scores.
12. David Engel,Anita Williams Woolley,Lisa X.Jing,Christopher F.Chabris,and Thomas
W.Malone,“Reading the Mind in the Eyes or Reading Between the Lines? Theory of Mind
Predicts Effective Collaboration Equally Well Online and Face-to-Face,”PLOS One
9,no.12(2014),http:www.plosone.org articleinfo% 3Adoi%2F10.1371%2Fjournal.p
one.0115212,doi:10.1371journal .pone.0115212.
13. Ishani Aggarwal,Anita Williams Woolley,Christopher F.Chabris,and Thomas
W.Malone,“Cognitive Diversity,Collective Intelligence and Learning in
Teams,”presented at the 2015 European Academy of Management
Conference,Warsaw,Poland,June 17-20,2015.14. Maria Kozhevnikov,“Cognitive Styles in the Context of Modern Psychology:Toward
an Integrated Framework,”Psychological Bulletin 133(2007):464-81.
15. Aggarwal,“Cognitive Diversity”;John B.Van Huyck,Raymond C.Battalio,and Richard
O.Beil,“Tacit Coordination Games,Strategic Uncertainty,and Coordination
Failure,”The American Economic Review 80,no.1(1990):234-48;Cary Deck and Nikos
Nikiforakis,“Perfect and Imperfect Real-Time Monitoring in a Minimum-Effort
Game,”Experimental Economics 15,no.1(2012):71-88.
16. Figure from Aggarwal,“Cognitive Diversity,”2015.Reprinted by permission of
authors.
17. David Engel,Anita Williams Woolley,Ishani Aggarwal,Christopher F.
Chabris,Masamichi Takahashi,Keiichi Nemoto,Carolin Kaiser,Young Ji Kim,and
Thomas W.Malone,“Collective Intelligence in Computer-Mediated Collaboration Emerges
in Different Contexts and Cultures,”Proceedings of the SIGCHI Conference on Human
Factors in Computing Systems(New York:Association for Computing
Machinery,2015),doi:10.11452702123.2702259(conference held in Seoul,South
Korea,April 18-23,2015).
18. Young Ji Kim,David Engel,Anita Williams Woolley,Jeffery Yu-Ting Lin,Naomi
McArthur,and Thomas W.Malone,“What Makes a Strong Team?Using Collective
Intelligence to Predict Team Performance in League of Legends,”Proceedings of the
ACM Conference on Computer-Supported Cooperative Work and Social Computing(New
York:Association for Computing
Machinery,2017),http:dx.doi.org10.11452998181.2998185(conference held in
Portland,OR,February 25-March 1,2017).
19. 截至作者写作本书的时间。而自2018年6月26日起,通用电气已被踢出道·琼斯工业平均指数。
20. Steve Schaefer,“The First 12 Dow Components:Where Are They Now?”Forbes,July
15,2011,http:www.forbes.comsitessteveschaefer20110715the-first-12-dow-
components-where-are-they-now.
21. Martin Baily,Charles Hulten,and David Campbell,“Productivity Dynamics in
Manufacturing Plants,”Brookings Papers on Economic
Activity:Microeconomics(1992):187-267,doi:10.23072534764;Eric Bartelsman and
Phoebus Dhrymes,“Productivity Dynamics:U.S.Manufacturing Plants,1972-1986,”Journal
of Productivity Analysis 9,no.1(1998):5-34,doi:10.1023A:101838362;Eric Bartelsman
and Mark Doms,“Understanding Productivity:Lessons from Longitudinal
Microdata,”Journal of Economic Literature 38,no.3(2000):569-
94,doi:10.1257jel.38.3.569.
22. Baily et al.,“Productivity Dynamics,”187-267.
The statistics reported here count plants weighted by their employmentnumbers.The more workers plants employed,the more heavily they were weighted.第二部分
计算机如何能让超级思维更聪明?第3章
人类将如何与计算机一起工作?
许多人认为计算机科学的未来就是人工智能。那么,根据你给人工智能下的定
义,谷歌公司的在线搜索引擎几乎肯定是当今世界上人工智能得到最广泛应用的案
例了。全世界每秒钟有超过230万人往谷歌搜索栏中输入关键词,然后看到与这次搜
索相关的网页列表。事实上,世界上每7个人中有不止一个人使用谷歌搜索引擎的频
率达到每月一次,他们平均每天使用三次谷歌搜索引擎。
但是,谷歌搜索引擎并不像《星球大战》中的机器人R2–D2、C–3PO和终结者,或者我们在科幻小说中看到的其他大多数人工智能机器人。相反,? 与其说它是同伴,不如说它是一种工具或者一位助手;
它的外形和行为都不像人类;
它通常不通过对话式语句与人类交流。
我认为,在未来几十年甚至更长的时间里,人们使用计算机的最主要方式可能
更像谷歌,而不是畅销小说中的虚构机器人。在这一章中,我们将会看到为什么每
一种大众印象都有可能是错误的,以及未来更有可能是什么样子的。
相较于人类,计算机将会扮演什么角色?
关于计算机在这个世界上的真实用途,首先要注意的一点是,人类总以某种方
式参与其中。即使计算机可以从头到尾独立完成一项任务,人们也总要先进行软件
开发,随着时间推移通常还要对其进行修改。人类要决定在不同情况下使用不同程
序的时机,以及当出现问题时应该做什么。而且,在很多情况下,对于机器无法完
成的那部分工作,人类自始至终都要参与其中。在探讨人类与计算机将如何一起工作的问题时,一种有效的方法是思考相较于
人类,计算机可以扮演什么角色。当机器仅扮演工具的角色时,人类拥有的控制权
是最大的,而随着机器的角色扩展为助手、同伴和最终的管理者,它的控制权也越
来越大。
工具
像锤子或者割草机这样的实物工具,尽管能做一些人类个体做不到的事情,但
作为使用者,人类每次都要对实物工具进行直接控制,引导它们的行动并监控其进
度。信息工具亦如此,当你使用字词处理器、电子表格或者在线日历时,机器做的
都是你让它做的事情(即使这并不总是你真正想让它做的事情)。
在许多情况下,自动化工具可以大幅提高人类使用者的专业智能。例如,一位
使用电子表格的财务分析师会比试图做心算的人更快、更准确地完成更多计算,使
用计算机辅助设计工具的建筑师会比只用纸笔的人更快更准确地对设计进行创作、修改和测量。
然而,未来自动化工具的很多最重要的用途将不是增加个人用户的专业智能,而是通过帮助人类更有效地相互沟通来提高团队的集体智能。事实上,我们在第1章
中已经看到,目前计算机的最主要用途都是帮助人类相互交流:电子邮件、文字处
理、短信,以及大部分网络或者手机应用程序,比如维基百科、脸书、推特和
YouTube视频等。在所有这些情况下,计算机并没有做多少“智能化”的处理,主
要是将人类创建的信息传递出去。
我认为,如果你观察一下我们现在使用计算机的实际方式,就会发现这一点显
而易见,但大多数人仍然认为计算机主要是用于计算的机器。这有可能是因为计算
机最初的用途确实是计算;这也有可能只是出于词源学方面的原因,毕
竟“computer”(计算机)是由动词“compute”(计算)派生而来的;这还有可
能是因为我们长期以来都把计算机视为“电脑”。
不管导致这种错误认知的原因是什么,有一点很清楚,那就是到目前为止计算
机主要用于帮助人类沟通。而且我认为,计算机的这种使用方式短期内不会发生改
变。至少在未来10年、20年甚至更长的时间内,计算机最常见的用途仍然是帮助人
类相互交流的精密工具。助手
与工具不同的是,人类助手可以在无须你直接关注的情况下工作,并且通常会
在试图实现你设定的总体目标方面表现得更积极主动。尽管自动化助手的表现与之
类似,但工具和助手之间的界限并不总是那么清晰。例如,尽管短信平台通常属于
工具范畴,但它们有时会在你没有提出要求的情况下自动纠正拼写(偶尔还会给出
令人捧腹的结果 )。
谷歌搜索引擎也是一种工具:在你输入关键词后,它会显示出包含这些关键词
的网站。不过,为了瞬时完成这项工作,谷歌的算法一直在后台运行着,不断更新
基本上囊括所有网页的庞大索引。而且,谷歌的搜索算法会在搜索结果的显示顺序
上行使相当大的决定权。由于它们在完成所有这些任务时并未得到你的任何关注,所以它们实际上是工具和助手的某种结合体。
随着机器控制权的不断增大,以谷歌智能助理和亚马逊语音助手Alexa为代表的
自动化系统致力于成为用户的助手,而不只是工具,特别是当它们做一些像主动向
你提供你未查询的信息这样的事情时,比如为了让你赶上飞机,提醒你必须现在出
发去机场。同样地,全自动驾驶汽车显然也将成为助手,它会类似出租车的人类驾
驶员一样,自主导航穿过车流,把你送到指定目的地。
自动化助手的另一个案例是在线服装零售商Stitch Fix公司使用的软件,它能
帮助人类时装设计师向顾客推荐产品。 Stitch Fix公司的顾客先要填写有关他们
的穿衣风格、尺码和价格偏好的详细问卷,然后,所有这些信息都会被机器学习算
法消化掉,并据此挑选出有可能让顾客中意的服装产品,供时装设计师考虑。不
过,最终决定将每批衣服中的哪5件寄送给顾客的是时装设计师。顾客只需为他们想
要的产品付款,并将其他产品退回。
在这种合作关系中的算法助手,能比人类时装设计师考虑到更多的信息。例
如,尽管大多数人都觉得通常很难买到时尚又合身的牛仔裤,但裤管内缝的长度其
实是一个判断牛仔裤是否合身的良好指标,而且算法能为每位顾客挑选出与他的裤
子内缝长度相同的其他顾客决定购买的各种牛仔裤。
然而,人类时装设计师也能考虑到机器考虑不到的信息,比如,顾客想要的是
参加准妈妈派对的服装,还是出席商务会议的服装。当然,与机器相比,人类时装
设计师能以更个性化的方式满足人类顾客的需要。因此,人类与计算机的组合能够提供比其中任何一方更好的服务。
在另一个迥然不同的行业中,由IBM(国际商业机器公司)与克利夫兰医学中心
合作开发的WatsonPaths软件也是一种自动化助手。它与击败智力竞赛类电视节
目《危险边缘》的人类冠军的超级电脑“沃森”(Watson),都构建在同样的基础
技术之上。WatsonPaths利用它从医学文献中收集到的知识,给出符合患者症状和
病史的多种可能的诊断。
然后,和Stitch Fix软件一样,Watson Paths会向医生展示多种合理的诊断
和它利用的推理链,以及这些不同诊断的置信度。尽管人类医生对如何治疗患者拥
有最终决策权,但自动化医疗助手能帮助他们考虑海量的医学文献,并提出他们可
能从未考虑过的诊断。
同伴
计算机最有趣的一些用途与它扮演的某种角色有关,那就是它作为人类的同
伴,而不是助手或工具,即使是在并未用到太多真实的人工智能的情况下。
这在很多情况下都会发生,因为一个程序对一个人来说是助手,对另一个人来
说则是同伴。例如,如果你乘坐一辆自动驾驶汽车出行,我也驾车行驶在同一条路
上,你的驾驶助手就是我的驾驶同伴。如果你是一名股票交易员,那么你可能会在
不知情的情况下,与别人的自动交易系统进行交易。如果你正在易贝(eBay)拍卖
网站上竞价,那么你的竞争对手可能会利用自动秒杀软件,在拍卖结束前的最后几
秒钟开出高于你的价格。
有时,自动化同伴并不会代表某个人的利益,而旨在提升整个团队的利益。例
如,你的工作是为Lemonade保险公司处理理赔业务,而且你有一个名为“AI吉
姆”的自动化同伴。 AI吉姆是一个在线“机器人”,当客户提出理赔申请时,会
通过与AI吉姆互发文本信息的方式完成。如果他们的理赔申请符合某些参数,机器
人几乎马上就会自动支付理赔款。否则,这项理赔申请就会被提交给某位职员,后
者会做所需的任何额外处理工作。
维基百科也有许多能自动进行某些编辑,并把其他可能需要编辑的部分告知人
类的机器人。 例如,一个机器人会利用机器学习算法自动撤销对文章进行的那些
很可能只是故意破坏的修改(比如添加污言秽语);而另一个机器人则会自动检查新页面,看它们是否包含了大量出现在网络上其他地方的文本。如果确实如此,机
器人就会将其标记为需要人类注意的潜在侵权问题。
换句话说,维基百科的人类编辑和机器人就像同事一样,都在编辑相同的文
章。由于机器人全部是由人类管理的,所以在某种意义上,它们只是其人类主人的
助手。但如果你是一个试图损害维基百科网页的人类破坏者,撤销恶意更改的机器
人执行的任务就和其人类同伴的任务完全相同。而且,这对维基百科内容的总体效
果几乎肯定比没有计算机作为人类同伴的情况要好。
管理者
人类管理者会委派任务、提供指导、评估工作,并协调其他人的行动。机器也
能做到这些事情,而且当它们这样做的时候,就会成为自动化的管理人员。尽管有
些人觉得让机器来做管理者的这一想法风险很大,但我们每天都在和这样的机器打
交道。例如,交通信号灯替代了人类警察,在十字路口起到指挥交通的作用。再例
如,电话呼叫中心的机器会自动为客服人员转接电话,而这原本是一项由人类管理
者负责的任务。不过,大多数人都不认为这两种情况会导致什么风险或者问题。
我认为,将来机器扮演管理者角色的情况可能会更多。例如,由我的朋友阿尼
基特·基图尔(Aniket Kittur)、罗伯特·克劳特(Robert Kraut)及他们在卡内
基–梅隆大学的同事开发的CrowdForge众包工作流系统,可用于组织在线工作者撰
写像百科全书文章一样的文档。 我们把这些在线工作者称为“土耳其
人”(Turkers),因为他们都是通过亚马逊公司的一个名为“土耳其机器
人”(Mechanical Turk)的服务平台招募来的,我们稍后会详细介绍这个网站。
一开始,CrowdForge系统会要求“土耳其人”为某篇文档(比如,一篇关于纽
约市的百科全书文章)拟定一个大纲,它可能会包括风景名胜和简史等(见下
图)。 然后,针对大纲中的每个部分,系统会要求其他“土耳其人”找到可能与
该部分相关的资料。接下来,系统会收集与各个部分相关的资料,并把它们发送给
另外一些“土耳其人”,他们将根据收到的资料为这一部分写一个段落。最后,系
统会把所有段落放在一起,形成一篇完整的百科全书文章。以这种方式创作的文
章,平均每篇需要有36个不同的人完成36项独立的子任务,而且成本只有3.26美
元。当研究人员让其他“土耳其人”评价这些文章时,他们都认为这些文章比一个
人花同样多的钱写出来的类似文章要好得多,而且它们的质量与简明英语版维基百
科中的文章大致相当。
换句话说,在这个过程中,研究人员为自己创造了一位自动化助手。这位助手
通过将任务委派给一个“土耳其人”团队,并协调任务之间的相互关系来帮助研究
人员管理这些在线工作者。尽管对“土耳其人”来说,这与完成人类管理者委派给他们的任务并无不同,但自动化系统可以让这个过程覆盖庞大的撰稿人群体。
我认为,这种可称为“产业化写作”的形式未来会变得更普遍。例如,在当今
世界,我们使用的几乎所有家具和服装都是在工厂里生产出来的,而且在每件产品
的生产过程中,都有很多人(通常还有很多机器)参与其中。虽然我们偶尔也会买
一些像毛衣或椅子这样的手工制品,但这些肯定是例外,而不是常规。同样地,我
猜测在不远的将来,我们看到的许多书面材料可能都是在像CrowdForge系统这样的
产业化写作过程中产生的。而且,在后面的章节中我们将会看到,越来越多的实际
写作任务可能都是由机器而不是人完成的。尽管我们并非再也看不到某个人写作的
长篇文本了,但它们总有一天可能会变得像今天的手工编织毛衣一样稀有。
人工智能机器看起来像什么?
哲学家马歇尔·麦克卢汉(Marshall McLuhan)指出,我们对新技术最初的认
识通常都来自与旧技术的对比。 例如,最早的汽车被称为无马马车,其外观也与
这个名称相符。它们看起来就像传统的马车一样,有包括踏脚板在内的所有部分,除了前面没有马。当然,随着时间的推移,新技术独特的必备条件和可能性也在汽
车设计中得到了体现。例如,由于汽车的行驶速度比马车快得多,所以它们就有了
光滑的流线型外观和将乘客车厢密封起来的车窗。
同样地,许多人想象人工智能机器的外观和行为会或多或少地类似于人类。除
了少数像R2–D2一样可爱的机器人外,大多数的虚构机器人都有两条胳膊、两条腿,以及一张长着一双眼睛、一个鼻子和一张嘴的脸。不过,在我们今天使用的真实人
工智能产品跟科幻小说中的机器人几乎完全不一样。谷歌搜索引擎、亚马逊语音助
手Alexa,以及银行使用的几百种信用审批算法看起来什么也不像。对与它们互动的
人类来说,它们只是存在于网络空间或者“云”的模糊世界中的无实体智能。
即使是做体力工作的机器人,通常看起来也不像可能从事过这类工作的人类。
例如,在亚马逊公司的仓库里搬运货物的机器人看起来就和搬箱子的人类不一样。
这些机器人是一些大约8英寸 高的橙色小盒子,面积约一平方英尺 ,底部有几
乎完全隐藏起来的小轮子。它们会在仓库里转来转去,钻到一个货架单位下方,把
它(以及上面的所有东西)抬起来,并搬到另一个地方。谷歌公司最新的无人驾驶汽车看起来也不像由机器人驾驶的传统汽车,而是彻
底移除了方向盘、制动踏板和加速器。所有的人工智能连同发动机和汽车的其他机
械零件一起,都被隐藏在乘客看不到的地方。
当你阅读这些文字的时候,我刚才举的例子可能听起来已经过时了,但我认为
我们未来使用的大多数人工智能产品,很可能会演变成与目标任务的实际要求相匹
配的独特形式,而非拥有与科幻小说中的机器人一样的类人形态。形式各异的人工
智能将以不同的方式嵌入不同的社会过程。
例如,用于生产和交付实体产品的供应链将包括各种负责制造、组装和运输实
物的机器,但其中每台机器都将拥有与其用途相匹配的独特外形。负责控制它们的
智能有时在机器内部,有时则在地球的另一边。在你生病时负责诊疗的机器,让你
的家保持清洁舒适的机器,以及为所有这类活动提供能量的机器,全都是如此。
什么时候我们会需要类人机器人?
在对这种几乎看不见的智能做一般性预测时,要考虑到两种重要的例外情况。
第一,一些体力工作需要在为人类设计的物理环境中完成,为了在人类环境中自如
行动,机器人可能就需要有类人外形。例如,如果你想让一个机器人为你做饭、整
理床铺,并且帮你搬运家里的其他东西,你就需要它能穿过你家的门道和爬楼梯。
这样的机器人可能看起来很像人类。
第二,我们可以仅为了满足人类与类人生物交流的愿望而创造出看起来像人类
的机器人。例如,Baxter智能协作机器人是美国的一家机器人公司Rethink
Robotics制造的一款工业机器人,其设计目的是在工厂中完成工人目前所做的体力
工作。Baxter有像人类一样的双臂,在它两臂间的躯体上部,也就是相当于人类头
部的位置,还有一张类似人类的脸,这可能并非偶然。尽管这里需要有一张脸或一
个头不是出于技术原因,但Baxter的设计师可能认为,如果工厂里的工人与看起来
像人类的机器人一起工作,会感觉更舒服。
如果人工智能的未来与其他信息技术的历史有相似之处,那么我们几乎可以肯
定的是,它也会被用于色情目的。CD(光盘)、DVD(数字光盘)和互联网的一些早
期用途就与色情作品有关,而且将来似乎很有可能出现基于人工智能的性爱机器
人。我们如何与计算机交流?
在几十万年的生物与文化进化历程中,人类已经开发出多种相互交流的方式。
其中最重要的方式可能是,利用英语、汉语或斯瓦希里语等语言中的词汇进行交
谈。而且,发明这些语言的书面版本的重要性,怎么强调都不为过。不过,人类也
会用其他许多方式进行交流,比如面部表情和手势,相互触摸,给彼此唱歌或者进
行艺术创作。
因为许多年来人类一直在利用所有这些交流方式,所以我们早已对它们习以为
常,自然而然地,我们也想以同样的方式与机器进行交流。例如,亚马逊公司的智
能语音助理Alexa和苹果公司的智能语音助理Siri等系统已经能够有限地使用英语
等人类的日常语言,而且随着时间的推移,机器使用人类语言与我们交流的能力会
越来越强。这意味着将会有更多的计算机系统利用语音或文本与我们就特定任务进
行沟通。但我们将在下一章中看到,要想让机器像人类一样全面灵活地使用和理解
人类的日常语言,可能还需要数十年艰难的技术攻关。
即使能在技术上实现这一目标,我们也不会总想用与他人沟通的那些方式来与
机器交流,这背后有一个非常重要的原因:至少就某些目的而言,机器的交流能力
远远优于人类。其中最突出能力就是机器可以立即生成极其丰富的视觉图像,而人
类仅靠自身永远无法做到这一点。
例如,如果一个没有其他工具的人要为想去城市另一边的一家商店的你指路,他最多只能给你一连串包含地标和转向的口头指引。但即便是今天的计算机也可以
比这个人做得更好,因为它们会立即为你提供一张显示出完整路线的详细的可视化
地图。
想象一下,如果你想编辑一封信,而且要通过电话告诉某个人需要做哪些修
改。那么,你不得不说出这样的话:“找到第二段的第三句,把‘苏珊’一词替换
成‘约翰玛丽’,然后在这两个名字中间加上‘和’字。”想想看,如果你能像今
天使用计算机那样定位、点击鼠标和打字,这件事做起来该有多么容易。
我在麻省理工学院媒体实验室的同事石井裕(Hiroshi Ishii)利用“可触比
特”(tangible bits)和“自由基原子”(radical atoms)的概念,将这种与
计算机进行非语言交互的想法进行了深入扩展。许多年前,我曾和石井裕合作开展了一个研究项目。在这个项目中,我们让人们通过在一张特殊的桌子上移动小物
体,对公司供应链的不同布局做实验,这张桌子能够感知物体的位置。 例如,有
些物体代表工厂,有些物体代表仓库。通过移动和旋转这些物体,人们能看到,如
果他们移除一间仓库或者增加一间工厂的生产量,供应链的产能和订货交付时间会
发生什么变化。换句话说,人们不是通过语言告诉计算机他们想要评估的布局,而
是通过直接操控实体对象来实现。
最近,石井裕和他的同事一直在对更加前沿的人机交互方式进行实验。在这些
实验中,他们使用了人与计算机都能操控的三维材料。例如,在一个名为
SoundFORMS的研究项目中,用户能够利用一个可变形的显示组件来作曲,而且该组
件能够展现出作曲过程中的声波(见下图)。用户可以用手触摸显示组件,并改变
声波的实际形状。
或者我们想想工业机器人Baxter。目前,大多数的机器人在处理新任务前,都
需要进行非常详细的程序设计,但你只要按照自己想要的方式去移动Baxter的手
臂,就能安排它做一些新事情。
从长远来看,人类与机器交互的终极方式可能将会是一种心灵上的融合,也就
是机器与人类大脑中不同神经元之间的直接神经连接。当然,我们在短期内无法做
到这一点,不过一些早期实验的结果表明其前景光明。例如,最近由加州理工学院
的理查德·安德森(Richard Andersen)领导的一个研究团队,将一只机械臂与被
植入一名男性大脑中的硅片连接起来,这名男性13年来一直处于颈部以下瘫痪的状态。 经过练习,他只需要通过思考它就能移动机械臂,除了做其他事情以外,他
还成功地自己举杯喝了瓶啤酒。
尽管我们并不确定这项技术会以多快的速度发展,但我的态度非常乐观,甚至
还和朋友开玩笑说我想成为第一位接受神经植入的90岁老人。按照目前的发展速
度,在我们拥有像人类一样能充分使用和理解人类日常语言(比如英语)的机器之
前,很有可能先实现功能强大的神经接口。
我们在上一章中看到,一个人类团队要想变聪明,其成员必须善于合作。同样
地,当人类团队中加入计算机时,也需要人与计算机能良好地相互合作。尽管有时
最好的方法是让人类学会如何更好地与计算机合作,但在大多数情况下,最好的方
法应该是设计出能与人类有效协作的计算机。我们在这一章中已经看到,在实现这
一目标的过程中,有很多前景光明的可能性。当我们考虑这些可能性时,会遇到一
个关键问题:计算机未来的智能水平——尤其是通用智能水平——将会如何?
1. The Google statistics are from Craig Smith,“270 Amazing Google Statistics and
Facts(August 2017),”DMR,modified August
13,2017,http:expandedramblings.comindex.phpby-the-numbers-a-gigantic-list-of-
google-stats-and-facts.
If there are 1.17 billion monthly unique searchers and a world population of
about 7.4 billion(see United States Census Bureau,“U.S.and World Population
Clock,”accessed September 21,2017,https:www.census.govpopclock),this means that
about one in seven people in the world do a search each month.One hundred billion
searches per month means about three per user per day.
2. See http:damnyouautocorrect.com.
3. H.James Wilson,Paul Daugherty,and Prashant Shukla,“How One Clothing Company
Blends AI and Human Expertise,”Harvard Business Review,November
21,2016,https:hbr.org201611how-one-clothing-company-blends-ai-and-human-
expertise.
4. “WatsonPaths,”IBM,accessed August 17,2016,https:www.research.ibm
.comcognitive-computingwatsonwatsonpaths.shtml?
cmp=usbrbcm=scsr=watson.site_20140319cr=workct=usbrb301cn=s1healthcare.
5. Shai Wininger,“The Secret Behind Lemonade’s Instant
Insurance,”Lemonade,November 23,2016,https:stories.lemonade.comthe-secret-
behind-lemonades-instant-insurance-3129537d661.6. Wikipedia,s.v.“Wikipedia:Bots,”accessed August 18,2016,https:en.wikipedia
.orgwikiWikipedia:Bots.
7. Aniket Kittur,Boris Smus,Susheel Khamkar,and Robert
E.Kraut,“CrowdForge:Crowdsourcing Complex Work,”in Proceedings of the ACM
Symposium on User Interface Software and Technology(New York:ACM
Press,2011),http:smus.comcrowdforgecrowdforge-uist-11.pdf.
8. Figure from Kittur A.,Smus,B.,Khamkar,S.,Kraut,R.E.,“CrowdForge:Crowdsourcing
Complex Work.”UIST 2011:Proceedings of the ACM Symposium on User Interface Software
and Technology.New York:ACM Press,http:doi.acm .org10.11452 047196.2047202.? 2011
Association for Computing Machinery,Inc.Reprinted by permission.
9. Simple English Wikipedia,accessed October 21,2017,https:simple.wikipedia
.orgwikiMain_Page.
10. Mar shall McLuhan,Understanding Media(New York:Mc Graw-Hill,1964).
11. 1英寸≈ 0.254米。——编者注
12. 1平方英尺≈ 0.093平方米。——编者注
13. James H.Hines,Thomas W.Malone,Paulo Gonsalves,George Herman,John Quimby,Mary
Murphy-Hoye,James Rice,James Patten,and Hiroshi Ishii,“Construction by
Replacement:A New Approach to Simulation Modeling,”System Dynamics Review
27,no.1(July 28,2010):64-90,http:onlinelibrary
.wiley.comdoi10.1002sdr.437abstract,doi:10.1002sdr.437.
14. Aubrey Colter,Patlapa Davivongsa,Donald Derek Haddad,Halla Moore,Bruan Tice,and
Hiroshi Ishii,“SoundFORMS:Manipulating Sound Through Touch,”in Proceedings of the
2016 CHI Conference Extended Abstracts on Human Factors in Computing Systems(New
York:Association for Computing Machinery,2016),2,425-30.
The photograph is from the above paper and is available online at https:
tangible.media.mit.eduprojectsoundform,where you can also see a fascinating video
of the system in operation.Photograph ? Tangible Media Group,MIT Media
Lab.Reprinted with permission.
15. Erico Guizzo and Evan Ackerman,“How Rethink Robotics Built Its New Baxter Robot
Worker,”IEEE Spectrum,September 18,2012,http:spectrum
.ieee.orgroboticsindustrial-robotsrethink-robotics-baxter-robot-factory -worker.
16. Robert Lee Hotz,“Neural Implants Let Paralyzed Man Take a Drink,”Wall Street
Journal,May 21,2015,http:www.wsj.comarticlesneural-implants-let-paralyzed-man-
take-a-drink-1432231201;Tyson Aflalo,Spencer Kellis, Christian Klaes,Brian Lee,Ying
Shi,Kelsie Shanfield,Stephanie Hayes-Jackson,et al.,“Decoding Motor Imagery from
the Posterior Parietal Cortex of a Tetraplegic Human,”Science 348,no.6,237(May22,2015):906-910,http:science.sciencemag.orgcontent3486237906.full,doi
:10.1126science.aaa5417.第4章
计算机将能达到什么样的通用智能水平?
与许多重要的概念一样,人工智能这个术语很难定义。 有些人用它来指
代“像人类一样能够思考或行动的机器”。例如,著名的图灵测试 认为,如果向
计算机提问的人无法判断答案是来自人类还是机器,这台计算机就可以被视为“智
能”的。人工智能的另一个定义是“能理性行动的机器”,哪怕它们的做事方式与
人类不同甚至有可能比人类更佳。例如,尽管谷歌搜索算法几乎不可能以人类记忆
事情的方式来“记住”网页,但在找到谷歌用户正在寻找的网页方面,它表现得非
常好。
或许,人工智能最简单的定义是“由机器展现出的智能”。 然后,根据第1章
中我们对智能的定义,可以说人工智能就像人类智能一样有专业和通用之分。
关于今天的人工智能,大多数人都没有意识到的最重要的事情之一,就是它们
都非常专业化。 尽管谷歌搜索引擎十分擅长检索有关棒球比赛的新闻报道,但它
并不能独立写出关于你儿子所在的少年棒球联赛的文章。尽管IBM公司的超级电
脑“沃森” 比最优秀的人类更擅长玩《危险边缘》智力问答游戏,但它的程序版
本却不会玩井字棋,更不用说国际象棋了。特斯拉公司的自动驾驶汽车十分擅长在
标示清晰的车道上行驶,但它们不能从仓库货架上取下一个盒子,并把它送到打包
站。
当然,也有能做到其他事情的计算机系统。但关键问题在于,它们全都是不同
的专业化程序,而不是能在每种特定情境中知道该做什么的通用人工智能。在每种
情况下,人类都必须利用他们的通用智能编写包含解决不同的具体问题所需规则的
程序,还要决定在特定情况下应该运行哪些程序。
如果有可能,机器什么时候将真正拥有通用智能?如果目前这种状况会发生改变的话,最快将是什么时候呢?有些人认为,机器
永远无法胜任人类做的那些精妙和智慧的事情。换句话说,他们认为机器永远不会
拥有通用智能。
在某些情况下,这种观点的哲学依据是,即使机器能做到人类做的所有事情,它仍然算不上真正拥有了智能,因为只有人类才拥有智能。 我承认,我完全无法
接受这个观点。对我来说,这就好比问计算机科学家艾兹格·迪科斯彻(Edsger
Dijkstra)问过的那个问题:“潜艇会游泳吗?” 由于鱼和潜艇都是靠自身力量
在水中移动的,你用哪个词来描述这种现象,是一个纯粹的语义学问题。在英语
中,将“swim”(游泳)与潜艇搭配在一起听起来有些奇怪,但在俄语中听起来则
非常自然。 换句话说,这场争论的焦点并不是事实,而只是我们想如何定义用于
描述这些事实的词语。
同样地,机器能否拥有智能的哲学问题,实际上只是关于我们想如何定义“智
能”这个词的争论。在我看来,正如我们在第1章中所做的,以一种可以将机器包括
在内的方式定义人工智能是完全合理的。
还有人认为,机器永远无法拥有通用智能,因为实现这一目标所需解决的实际
问题太难了,我们根本解决不了;或者即使我们能解决它们,需要花费的时间也将
远远超出现在活着的所有人的寿命。这种说法明显是站不住脚的。我以前的学生、现在的同事埃里克·布莱恩约弗森(Erik Brynjolfsson)和他的合著者安德鲁·麦
卡菲(Andrew McAfee)认为,计算机硬件的不断进步和人工智能的惊人发展速
度,可能很快就会使机器拥有通用智能。 而人工智能专家罗德尼·布鲁克斯
(Rodney Brooks)则认为,这可能需要几百年的时间。
事实上,从20世纪50年代,也就是人工智能发展早期开始,这一领域的进展就
一直是出了名的难以预测。例如,研究人员斯图尔特·阿姆斯特朗(Stuart
Armstrong)和卡伊·索塔拉(Kaj Sotala)对1950~2012年的95个关于通用人工智
能将在何时实现的预测进行了分析。 他们发现,不管预测是在什么时候做出的,专家和非专家都倾向于认为通用人工智能将在未来的15~25年内实现!换句话说,在
过去的60年里,通用人工智能似乎一直距离我们“20年”之遥。
新近的调查和访谈结果与这种长期模式也是一致的:人们仍然预测通用人工智
能将在未来的15~25年内实现。 所以,尽管我们并不知道确切答案,但至少有良好的理由对通用人工智能将在“未来几十年”内出现的自信预测表示怀疑。我个人
的观点是,如果不发生一些重大社会灾难,通用人工智能很有可能会在未来的某一
天出现,不过也许是在好几十年之后。
计算机编程难在哪里?
要理解通用人工智能为什么如此难以实现,你需要先了解计算机编程难在哪
里。如果你从事过任何重要的计算机编程工作,那么你已经直接经历过相关挑战
了。但如果你没有这方面的经历,我会尽力让你对它有一个快速的基本认识。
基本问题在于,所有现代数字计算机的核心都是“处理器”,从某种意义上
说,处理器是非常愚蠢的。我在给读MBA(工商管理学硕士)的学生上基础信息技术
课时,用到了我在麻省理工学院的同事斯图尔特·马德尼克(Stuart Madnick)提
出的一个类比,来帮助人们理解这些处理器能做什么。马德尼克描绘了一台虚构的
计算机,叫作“小矮人计算机”。 这台虚构计算机包含一位在一个小房间中工作
的小矮人(见下图)。但是,这个小矮人很愚笨,他只能做大约10件非常简单的事
情。这个小房间的墙上有一个收信箱和一个发信箱,他可以通过它们和每张写着一
个三位数的纸条与外界交流。房间里还有一块黑板,上面包括100个用编号标记的位
置,他可以在这里读取和写入三位数。他还有一个计算器,用于对这些三位数进行
加减运算。每当这个小矮人做完一件事时,就会看看他之前写在黑板的某个位置上的数
字,然后把这个数字解读为他要执行的“指令”,从而决定接下来做什么。例如,如果指令是“901”,他就知道这个代码意味着他应该在计算器中输入收件箱中的数
字。如果指令以1开头,他就知道这意味着要“做加法运算”。例如,如果指令是
145,就意味着他应该把黑板上的45号位置对应的数字与计算器里的数字相加。
他有大约10条这样的指令,每条指令都有不同的代码,分别代表着输入和输出
数字、加减运算,以及增减黑板上的数字等任务。通常,他会按照指令在黑板上的
先后顺序来做事。但是,有时他也必须决定下一步该做什么。所以,他还有两个附
加指令,即依据计算器中的数字是0还是大于0,决定应该在哪个位置寻找他的下一
条指令。
为了弄清楚“小矮人计算机”的工作原理,我们假设这个小矮人需要把10个数
字加起来。要完成这项任务,他不仅需要把这些数字加在一起,还需要记录他加过
的数字个数。他可能会在黑板的某个位置上记录已经加过的所有数字的和,并在另
一个位置上记录他已经加过的数字个数。每当把一个新数字加到总和当中时,他也
会在数字的总个数上加1。然后,为了判断是否加完了所有10个数字,他可以用10减
去数字的总个数。如果结果大于0,就意味着他还没有加完所有10个数字,因此他会
继续执行加上一个新数字的指令。但如果结果是0,他就会到黑板的另一个位置上去寻找一组指令,比如,让他把运算结果放入发件箱。
这就是小矮人能做的所有事情。他只是遵照10条左右简单指令的不同组合做
事。在他的黑板上,一部分内容是告诉他该做什么的指令,这些指令构成了小矮人
的运行“程序”;另一部分内容就是他处理的“数据”。如果没有程序告诉他该做
什么,他就什么都做不了。而且,他使用的程序必须把他要做的每件事情分解成一
个个小步骤。
其神奇之处就在于,无论一台现代计算机在做什么——不管是将你最新的自拍
照发送给你在脸书网上的所有好友,还是决定何时让你的自助驾驶汽车减速——实
际上它都在执行大量非常简单的指令,这些指令的内容和小矮人能做的事情基本上
没有什么区别!当然,现代计算机可以访问“黑板”(存储器)的几百万个位置,在数量上远超小矮人计算机。这些位置存储着二进制数字(1和0),而不是我们通
常使用的十进制数字。而且,现代计算机每秒钟可以执行好几百万条指令,比任何
人都要快得多。尽管如此,它们做的所有事情实际上都只是简单指令的复杂组合。
难点在于,不管一个人想让计算机做什么,都必须为它编写一套指令。弄明白
如何让计算机通过执行它能真正理解的简单指令来完成复杂任务,是极其困难的一
件事。
这就是软件开发人员一天到晚都在做的事情,而且为了提高计算机的工作质量
和效率,他们已经开发出各种各样的技术。例如,几十年前,软件开发人员想出了
利用“高级编程语言”(像今天的Java和C语言)来编写程序,然后让其他程序(编
译器)把这些程序翻译成计算机真正需要的特定(机器语言)指令的方法,从而把
人从辛苦烦琐的编译工作中解放出来。
但是,即使有了这些强大的技术,编写计算机完成任务所需的详细指令(也被
称为程序、代码、算法或规则),对人类程序员来说也是一项繁重的工作。就算对
像会计系统这样相对简单的程序来说也是一样,更不用说复杂的人工智能程序了。
有一个事实会让你对这些程序的复杂程度有一个大致的了解:谷歌公司估计,它的
所有服务使用的高级语言版本的软件包含大约20亿行代码。
通向通用人工智能的可能路径那么,通用人工智能有望实现吗?当然有。尽管编写计算机程序很难,但我们
已经在研发具备各种能力(包括多种专业人工智能)的计算机方面取得了长足进
步。而且,我们已经掌握了许多其他类型的编程技术和计算机体系结构,这可能会
让我们离实现通用人工智能的目标更进一步。
让我们来看看其中几个可能的路径。
常识
想一想,要理解下面这一小段对话,你需要知道些什么:
人物A:我头痛。
人物B:街角的药店下午6点关门。
当然,你需要知道A和B对话使用的这些字词的意思。不过,你还需要知道其他
一些关于这个世界的事实,包括但不仅限于:
头痛是一种疾病;
患病的人通常会感到不舒服;
人们通常会尽量避免令人不舒服的事情;
服用药物是避免疾病带来的不适感的一种方法;
一种获得药物的方法是去药店购买;
只有在药店的营业时间,你才能买到药。
因此,对一台要像人类一样“理解”这一小段对话的计算机来说,它必须了解
所有这些事实。现在,把这几项具体事实以一种能让计算机对它们做一些推理的格
式进行编码和编程,并不太难做到。但是,哪怕只是朝通用智能的目标前进一小
步,这几项事实在需要掌握的数百万条关于这个世界的事实中只不过是沧海一粟。
当然,人类在孩童时期就学过这些东西,而且由于我们了解它们,所以在我们看来
它们是显而易见的。我们只把它们当作常识。但是,计算机必须以某种方式获取上百万条这样的事实。要想实现这一点,最
明显的方法就是让人类程序员编写出能对这些知识以机器可以利用的格式进行编码
的程序。
在这个方面最具雄心的尝试可能来自计算机科学家道格·莱纳特(Doug
Lenat),他于1984年发起并领导开展了Cyc项目。 从那时起,道格及其同事花了
很多时间,煞费苦心地将几百万条事实(关于疾病、天气和政治等主题)编入了一
个供计算机使用的大型常识数据库。
尽管这个路径将在多大程度上推动通用人工智能的实现还是未知数,但与此同
时,它已经被应用于一些项目,例如,帮助克利夫兰医学中心的医生找到临床研究
所需的患者,这些患者具有某些临床表现,比如有“心包开窗术后发生细菌感
染”的病史。
大数据
近年来,在开发有效的人工智能方面取得的显著进展,有时得益于我们能以比
过去更便捷的方式获取大量的可用数据。
例如,人类语言(比如英语和西班牙语)的机器翻译,一直是人工智能研究领
域的“圣杯”之一。几十年来,研究人员对实现这一目标的进展之缓慢备感失望。
但最近语言翻译程序取得了很大进步,部分原因在于大量翻译文档的可用性。例
如,谷歌翻译利用联合国的文件(通常由联合国的译员翻译成至少6种语言),计算
一种语言中的某个短语对应于其他语言中的不同短语的频率。例如,西班牙语中的
短语“darse cuenta”通常被翻译成英语中的“realize”(认识到),而不是直
译为“give account”(支出账户),这样一来,谷歌翻译就学会了该如何翻译
它。这个路径的关键之处在于,它不要求人类程序员掌握语言的所有复杂规则和习
惯用法,而只需要有能用一套较为简单的规则进行分析的大量可用文本。
机器学习
让计算机更智能的一个相关路径是,聚焦于开发计算机学习的方法。这样一
来,人类程序员就无须编写非常详细的规则,告诉计算机如何完成它们需要做的每
件小事,而只需编写能告诉计算机应该如何学习的一般规则,然后让计算机根据它们自己的经验来决定如何做其他事情。这种前景光明的路径叫作机器学习,其灵感
来源于人类的学习方式。人类天生就拥有深植于大脑的学习能力,而且在习得专项
能力时,不像今天的计算机那样需要有人为他们详细“编程”。
当然,没有人确切地知道人类是如何做到这一点的,而且通过编程让机器像人
类那样学习比听起来要困难得多,不过研究人员已经在这个方向取得了重要进展。
在某些情况下,他们会利用所谓的监督学习,也就是程序通过被告知对错来学习。
例如,如果你想训练一个程序去识别图片中是否有人脸,那么你可以给它看几千张
图片,并告诉它哪些图片中有人脸,而哪些没有。随着时间的推移,这个程序可以
调整它的统计参数,从而越来越擅长根据它赋予不同底层特征组合(比如,圆圈和
线在图片中的位置)的权重,预测哪些图片中有人脸。
如何进行所谓的无监督学习,这是一个难度更大的问题。这个概念是指你给了
计算机很多例子,但不告诉它你想让它从这些例子中学什么。如果你思考一下,就
会发现这正是我们人类了解这个世界的主要方式。例如,大多数婴儿都是在没有任
何人给他们明确解释引力的情况下,就习得了它的作用机制。
在最近有关计算机无监督学习的研究中,令人印象最深刻的一个是,一个由斯
坦福大学和谷歌公司的研究人员组成的团队,把来自YouTube视频的1 000万幅数字
图像提供给一个计算机系统,并让它寻找其中的规律。在研究人员没有告诉系统寻
找什么的情况下,它学会了识别包括人脸、人体和猫脸在内的两万种对象。 这个
系统利用一个被称为深度学习的路径实现了机器学习,该路径大致模拟了人脑中不
同层次的神经元之间的相互连接方式,具有特别光明的发展前景。
神经形态计算
要想创造出更智能的计算机,还有一个有趣的路径是研发出更接近人脑结构的
新型计算机硬件。“小矮人计算机”代表的是一次只执行一条指令的数字计算机,而且我们使用的几乎所有计算机都是以这种方式设计的。然而在最近几年,配备了
多核处理器的计算机越来越多,这相当于有几个小矮人在同一台计算机内并行工
作。
不过,人类大脑拥有与计算机截然不同的结构。人脑中并非只有一个甚至是几
个处理器在并行工作,而是有800亿~1 000亿个被称为神经元的处理器。 神经元以非常复杂的方式相互连接,而且从某种意义上说,所有神经元都在并行工作。尽
管在一台传统的数字计算机上对这种复杂性进行模拟原则上是可能的,但在实践中
创造出真正拥有数十亿个处理器在并行工作的计算机,可能才是更加可行的途径。
这样一来,通过编程让这些更像人脑的计算机以更接近人脑的方式运行,也许就会
容易得多。要做到这一点,我们需要使用一种与以前截然不同的计算机硬件的设计
方法,这是包括IBM、休斯研究实验室(HRL)等很多研究小组正在追求的目标。
通用人工智能会成为集体智能的一种形式吗?
上面提到的最后一个路径催生了一个有趣的可能性。我们知道人类大脑本身就
是集体智能的一种形式,它由几十亿个独立神经元构成,当作为一个整体运转时,这些神经元的行为方式看起来很智能。
因此,真正创造出通用人工智能的最佳方法之一可能是,在单个系统内部将许
多种不同的人工智能(比如我们刚刚提到的那些)结合起来,从而创造出一种集体
智能。事实上,人工智能之父马文·明斯基(Marvin Minsky)在他的著作《心智社
会》中也提到了这一点。在明斯基看来,一个心智社会是由许多较小的“智能
体”间的相互作用形成的,尽管这些智能体作为个体而言智能水平并不高,但他们
会共同创造出一个 ......
您现在查看是摘要介绍页, 详见PDF附件(4792KB,268页)。