当前位置: 首页 > 新闻 > 信息荟萃
编号:1621
角斗士海盗与信任博弈.pdf
http://www.100md.com 2020年1月13日
第1页
第8页
第15页
第29页
第33页
第71页

    参见附件(2303KB,126页)。

     角斗士海盗与信任博弈是由哈伊姆·夏皮拉所著,作者结合多年的研究,用生动有趣的案例向我们解释了什么是博弈论,博弈论对于我们生活社会的影响。

    角斗士海盗与信任博弈作者简介

    哈伊姆·夏皮拉

    1962年出生于立陶宛,在1977年移民至以色列。他凭借有关博弈论的学位论文,获得了数理遗传学博士学位。他的另一个博士学位是通过对无限的数学与哲学方法的研究获得的。他教授数学、心理学、哲学和文学。夏皮拉是七本畅销书的作者。

    作为一名作者,夏皮拉从来不是在说服读者认同他的观点,而是鼓励读者享受思考。他是以色列最致命和最受欢迎的演说家之一。主要发表关于创造力和战略思想、儿童文学中的存在主义哲学、快乐和乐观等题材的演说。他也是一名非常有造诣的钢琴演奏家和狂热的收藏家。

    角斗士海盗与信任博弈目录

    第一章 用餐者困境

    第二章 勒索者悖论

    第三章 最后通牒博弈

    第四章 人们参与的博弈

    第五章 婚姻介绍人

    第六章 教父和囚徒困境

    第七章 企鹅数学

    第八章 拍卖理论的简要介绍

    第九章 斗鸡博弈和古巴导弹危机

    第十章 谎言、 该死的谎言和统计数据

    第十一章 突破万难

    第十二章 关于公平分担责任

    第十三章 信任问题

    第十四章 如果没得选,怎么赌

    角斗士海盗与信任博弈内容简介

    哈伊姆·夏皮拉用许多生动有趣的案例向我们解释了什么是博弈论,以及不同的博弈者之间是如何做出决定的。

    博弈论是一种关于交互式决策的数学形式,假设每个人的决策目标是个人利益的最大化。博弈论的参与者可能是朋友、敌人、政党、国家或者任何有行为互动的实体,无论这个实体是集体或者个人。在博弈论中存在一个问题需要注意,作为一名参与者,你很难确定什么会有益于其他参与者。甚至,一些参与者不清楚自己的目标,或者不清楚这些目标是否会使我们受益。

    角斗士海盗与信任博弈截图

    角斗士、海盗与信任博弈

    [以]哈伊姆·夏皮拉 著

    云山 译

    中信出版集团目录

    引言

    第一章 用餐者困境

    第二章 勒索者悖论

    第三章 最后通牒博弈

    第四章 人们参与的博弈

    第五章 婚姻介绍人

    第六章 教父和囚徒困境

    第七章 企鹅数学

    第八章 拍卖理论的简要介绍

    第九章 斗鸡博弈和古巴导弹危机

    第十章 谎言、该死的谎言和统计数据

    第十一章 突破万难

    第十二章 关于公平分担责任

    第十三章 信任问题

    第十四章 如果没得选,怎么赌?结论 博弈论指导方针

    参考文献

    版权页引言

    本书讨论博弈论,并介绍一些重要的关于概率和统计的观点。这三大思想领

    域构成了我们在日常生活中做决定的科学基础。由于这些话题都相当严肃,所以

    我费了九牛二虎之力,尽量想让本书既严谨又有趣,至少不至于太沉闷。毕竟,享受生活和学习知识一样重要。

    另外,在本书中,你们将会学习到以下内容。

    ●认识诺贝尔经济学奖得主约翰·纳什,并熟悉著名的纳什均衡。

    ●学习《谈判的艺术》中的基本观点。

    ●回顾“囚徒困境”中的每个方面,并学习合作的重要性。

    ●介绍战略思维领域的世界冠军。

    ●审视稳定婚姻问题,并探究它如何通向诺贝尔奖。

    ●参观一个角斗场,并得到一个教练的位置。

    ●在拍卖中竞标,并希望避免“赢者的诅咒”。

    ●学习统计数据的支持在哪儿。

    ●了解手术室中概率的存在。

    ●发现斗鸡博弈与古巴导弹危机有何关联。

    ●建一座机场并分一份遗产。

    ●发出最后通牒并学习信任。●参与约翰·凯恩斯的选美比赛,并研究其与股票交易的关联。

    ●从博弈论的角度讨论公平的意义。

    ●认识杰克·斯帕罗船长,并发现海盗是如何民主瓜分财产的。

    ●寻求玩俄罗斯轮盘赌的最佳战略。第一章 用餐者困境

    如何快速失去许多朋友?

    在这一章里,我们会去一家餐厅,来看看博弈论到底是什么,为什么它这么

    重要。我也会举一些我们在日常生活中遇到的博弈论案例。

    请想象以下场景:汤姆走进一家餐厅,坐下来,翻开菜单,他发现这里有他

    最喜欢的一道菜——罗西尼牛排。这道菜以意大利伟大的作曲家焦阿基诺·罗西尼

    的姓氏命名。它将牛里脊肉排(即菲力牛排)用黄油在平底锅里煎过后,放在油

    煎面包块上,顶上放薄薄一层鹅肝酱,再用几片黑松露装饰一下,最后浇上马德

    拉酱汁。简言之,这道菜里的所有东西都不利于你的心脏健康。这确实是一道非

    常美味的菜,但也非常昂贵。假设它标价为200美元,现在汤姆必须决定:点还

    是不点。这听起来非常戏剧化,甚至有点莎士比亚风格,但这确实不是一个很难

    做的决定。汤姆需要做的只是想想这道菜带给他的快乐值不值这个标价。请记

    住,200美元对不同的人有不同的意义。对大街上的乞丐来说,这是一笔很大的

    财富。但如果你往比尔·盖茨的银行账户里转200美元,他不会感到有什么变化。

    不管怎样,这是一个相对简单的决定,也和博弈论毫不相干。

    那我为什么要给你讲这个故事呢?博弈论在这里又有什么作用?

    原因在此。设想汤姆并不是独自用餐,他是和9个朋友一起来到这家餐厅

    的。他们10人围坐在一张桌子旁,并且一致同意不要各付各的,而是平摊账单。

    除了汤姆之外,每人都点了自己的简餐:一份家常炸土豆;一个芝士汉堡;一杯

    咖啡;一杯苏打水;我什么都不要,谢谢;一杯热巧克力;等等。当他们都点完

    了,汤姆突然灵机一动,向服务员说道:“我要罗西尼牛排,劳驾。”他的决定看

    起来非常简单,且从经济和战略角度看都不错:他让自己欣赏了一场罗西尼美

    味“歌剧”,却只支付了其标价的十分之一。

    汤姆的选择是否正确?这究竟是不是一个好的点子呢?你认为他的9个朋友

    接下来会怎么做?(或者数学家会问,这场博弈将如何进行动态变化?)每一个作用力会引发一个反作用力

    (牛顿第三定律的缩略版)

    我了解汤姆的这些朋友,而且可以告诉你,他的这一举动无异于一次宣战。

    餐厅服务员被叫了回来,每个人都突然想起来他们非常饿,菜单上的那些昂贵的

    菜都很诱人。家常炸土豆很快被替换成卢布松松露饼。芝士汉堡不要了,换成一

    块2磅(约0.9千克)重的牛排。汤姆的那些朋友突然都变成了伟大的美食鉴赏

    家,专挑菜单上昂贵的那部分点,甚至还点了几瓶昂贵的葡萄酒。当最后结账

    时,大家平摊账单,每个人都要支付410美元。

    无独有偶,科学研究显示,当几个人分摊聚餐账单时,或当免费分发食物

    时,人们会要得更多——我相信你不会对此感到惊讶。

    汤姆意识到他犯了一个可怕的错误,但只有他犯了这个错误吗?每个人都不

    想吃亏,试图避免被汤姆用这种方式愚弄,结果点了他们根本不想点的食物,且

    付出的钱比他们原本想花在食物上的要多得多。我还没说他们因此摄入了多少卡

    路里……

    那他们是不是应该少花一些,仅让汤姆一人享受他的梦想美食呢?你来决

    定。不管怎样,这将是这群人的最后一次聚餐。

    这个在餐厅发生的场景展示出几位决策者之间的互动,是一个博弈论研究的

    现实案例。

    “互动决策理论或许对于那个常常被称为博弈论的学科而言,是个更具描述

    性的名称。”

    ——罗伯特·奥曼(摘自《论文集》)

    以色列数学家罗伯特·奥曼教授因其在博弈论领域的创举,在2005年获得诺贝

    尔经济学奖。根据他的定义,我们将博弈论确定为一种互动决策的数学形式化。

    在本书中,我会尽力避免使用数字和公式,很多优秀的书也都是这么做的。

    我会试着呈现这个专业更有趣的方面,并聚焦那些深刻的见解和要点。博弈论是将理性玩家的礼尚往来公式化,同时假设每一个玩家的目标是使其

    收益最大化,无论这个收益是什么。

    玩家可能会是朋友、敌人、政党、国家,或是其他任何有真正互动行为的行

    为体。博弈分析的问题之一是,作为一个玩家,很难知道什么能使每一个玩家都

    受益。另外,我们很多人甚至都不清楚自己的目标是什么,或者什么能使我们受

    益。

    我想我应该在此指出,参与者获得的奖赏不仅仅是用金钱来衡量的。奖赏是

    玩家在游戏结束后获得的满足感,它可能是积极的(如金钱、名声、客户、荣誉

    等),也可能是消极的(如谎言、浪费时间、财产被破坏、幻想破灭等)。

    如果我们参加一个游戏,游戏结果取决于其他玩家的决定,当我们即将要做

    一个决定时,我们就会假设,在大多数情况下,其他玩家会和我一样聪明和以自

    我为中心。也就是说,不要指望你在享受罗西尼牛排时,其他人会一边抿着苏打

    水,一边分摊账单,同时愉快地分享你的乐趣。

    我们有很多办法将博弈论运用到日常生活中:商业谈判或者政治谈判,设计

    一次拍卖(你既可以选择英国模式,即价格持续上升;也可以选择荷兰模式,即

    起价很高,然后持续砍价),边缘政策模型(古巴导弹危机,伊斯兰对西方世界

    的威胁),产品定价(可口可乐应在圣诞节前降价还是涨价,百事可乐应如何应

    对),街边小贩如何与偶遇的游客讨价还价(降低其货品价格的最佳速度是什

    么?降得太快可能会暗示商品不值钱,而降得太慢有可能让游客失去耐性而离

    开),捕鲸限制(所有那些仍和以前一样捕鲸的国家希望对其他国家设置捕鲸限

    制,因为若不设限,鲸鱼将很快灭绝),为棋盘游戏想出聪明的战略,理解合作

    的演变,求爱策略(人类和动物),军事战略,人与动物行为的进化(我的热情

    正在衰退,已经开始泛化),等等。

    真正的问题是,博弈论是否真的可以帮助人们改进日常做决定的方式?人们

    对此有不同观点。一些专家确信,博弈论能对几乎所有的事情都产生关键影响;

    但也有不少专家相信,博弈论只是一些好看的数学运算。无论如何,它是一个迷

    人的思想领域,为我们生活中各种各样的问题提供了无数的见解。

    我认为,教授和学习博弈论与其他事物的最好办法是通过案例。我们看的例子越多,就越能更好地理解事物。那么就让我们开始吧。第二章 勒索者悖论

    “让我们永远不要因为害怕而谈判,而要永远不害怕谈判。”

    ——约翰·肯尼迪

    在这一章中,我们将学习一个由罗伯特·奥曼发明的关于谈判的游戏。这个

    游戏很简单,但它有可能会误导人们——它隐藏了一些深刻的见解。

    勒索者悖论最初是由罗伯特·奥曼提出的。他是一位伟大的通过博弈论分析法

    来研究冲突与合作的专家。以下是我的解读。

    乔和莫走进一间黑屋子,里面有一位高个子、黑皮肤的神秘陌生人等着他

    们。他身着黑色西装,系着一条黑领带。他取下墨镜,将一个公文箱放在房间中

    间的一张桌子上。“在这里面,”他指着公文箱不容置疑地说道,“有100万美元现

    金。不久后这些钱就会成为你们的。但有一个条件,你们俩必须决定如何分这笔

    钱。只要你们能达成协议,任何协议都行,这钱就是你们的。如果达不成一致,这钱就还给我的老板。我现在把你们留在这里,你们考虑一下,我一个小时后再

    回来。”高个子男人说完就离开了。

    那么,让我来猜猜,你现在怎么想的:“这个太简单了吧!完全不需要动脑

    子。没有进行谈判的必要。我说,为什么一个诺贝尔奖得主会担心这样的事情?

    我没听漏什么吧?当然没有。这是世界上最简单的游戏了。乔和莫需要做的只

    是……”

    沉住气,我的朋友。先别着急下结论。请记住,事情往往不像看起来那么简

    单。如果这两个玩家只需要平分这笔现金然后回家,我不会在书里写他们。这是

    之后真正发生的事情:乔是一个好心和体面的人,相信他具有大多数人的素质。

    他满脸笑容地望向莫,一边搓着手一边说:“你相信那个人吗?他可真有趣!他给

    了我们一人50万美元。我们都不用谈判。让我们结束这个愚蠢的游戏,平分这笔钱,然后好好庆祝一番,怎么样?”

    “所以这对你来说只是一个愚蠢的游戏,是吗?”莫说道,语气听起来有些不

    友好。“我觉得很有意思。你在这里胡言乱语,愚蠢地建议要平分,我倒是有一个

    更加合理的解决办法。我的方案是这样的:我拿走90万美元,你拿走剩下的10万

    美元。你能拿这么多,是因为我今天心情刚好不错,知道吗?这是我最后的提

    议。接不接受随你便。如果你接受,你可以赚10万美元。如果你不接受,那也没

    问题。我们什么也拿不到,我一点儿也不在乎。”

    “你不是在开玩笑吧?”乔说道。他开始感到担心。

    “绝不!别忘了我的外号叫‘金钱怪兽’。你这样的人只配当我的早餐。我从不

    开玩笑,而且也没有这个习惯。这是我最后的报价,不容谈判!”

    “你这是怎么了?”乔都快喊起来了,“这是一个由充分了解情况的两个玩家参

    与的对称博弈。你没有任何理由应该比我多拿一分钱。这说不过去,而且一点儿

    也不公平。”

    “听着,你说的太多了,我头都疼了。”莫说,他的上嘴唇明显开始抽搐,“你

    再多说一句,我会把给你的那份降到5000美元。你现在要说的只是‘好吧,就这么

    做’,否则我们都空手离开。”

    于是,乔说:“好吧。”

    游戏结束。

    这在一个简单游戏里是如何发生的?乔在哪里做错了?

    当我在一份主流经济类报刊上提到这个游戏时,我遭遇了大量愤怒的政治声

    讨,左翼到右翼都有(这证明我的文章是平衡和公正的)。因为读者都理解,这

    不是关于乔和莫参加的一个游戏,而是有关我们真实生活的谈判。在很多年前,我曾有幸在奥曼教授的门下学习。奥曼教授认为,这个故事与阿以冲突密切相

    关,并且大体上能教我们一两点关于解决冲突的办法。我们也能在历史谈判中看

    到不同的勒索者悖论的影子,如1919年的巴黎和会(会议签署了《凡尔赛条

    约》)、1939年的《莫洛托夫-里宾特洛甫条约》(即《苏德互不侵犯条约》)、2002年的莫斯科大剧院人质危机,以及最近在伊朗共和国和几个大国之间进行的

    核谈判等。

    奥曼认为,以色列在与邻国启动谈判时,必须考虑以下三点:第一,它必须

    考虑面对谈判(或博弈)达不成任何协议的可能性;第二,它必须意识到谈判有

    可能反复;第三,它必须确定自己的底线,同时坚守住这条底线。 (本书分享更

    多索搜@雅书)

    我们先讨论前面两点。如果以色列不希望谈判无功而返,那么它就有战略上

    的缺陷,因为这个谈判不再是对称的。那个在心理上有失败准备的一方就会获得

    巨大的优势。同样,当乔愿意做出痛苦的让步,接受羞辱的条款以便达成协议

    时,他的立场会影响未来的谈判,因为当玩家再次碰面时,莫有可能会给出更差

    的条件。

    更重要的是,在真实生活中,时间也很关键。考虑一下,莫想勒索乔,乔不

    慌不忙,试着通过谈判来改变这一不公正的提议。莫坚持不变,乔再次努力,但

    时间一点点过去……突然有人敲门了,公文箱的主人回来了。

    “喂,你们两位达成一致意见了吗?”他问道,“还没有?好吧,钱我拿走了,再见。”他走了,留下诚实的乔和勒索者莫,他们一分钱也没有拿到。

    这实际上是商业界中尽人皆知的情况。我们时不时会听到这样的新闻,一家

    公司收到了一个试探性的收购报价,但还没等适当讨论,这一报价就被撤走了。

    一般情况下,我们需要考虑这个给定资源的性质,它的价值可能会随着时间的流

    逝而被崩减,尽管它都没被用过。我们把它称为“冰棒模型”:一个持续融化直到

    消失的好东西。

    这里有一个现代寓言。一个富得不能再富的商人做生意很有一套。他想出价

    购买一家公司,并规定他给出的价格每天都会缩点水。我们假设他向以色列和约

    旦政府出价,声称自己想出价1000亿美元购买死海(死海每天都在缩小,没准儿

    有一天真的会死去),而且他的出价每天都会降10亿美元。如果这两个国家经过

    官僚主义的繁文缛节或是政治纷争,最终花了相当长的时间才给出答复,他们很

    可能最终只能得到这个商人一小笔钱,让他拿走死海,这会让这个商人成为死海

    的主人,从而变得更加富裕。现在我要告诉你,从勒索者的故事中,我得出了以下结论。

    1.与一个非理性的对手进行理性的竞争往往是不理性的。

    2.与一个非理性的对手进行非理性的竞争往往是理性的。

    3.当你更深刻地思考这个游戏(以及生活中的类似场景)时,会发现理性的

    方式往往不那么清楚(就连“理性”这个词的含义都不清楚——毕竟,莫是这个游

    戏的赢家,并且拿走了90万美元)。

    4.当你试图从对手的角度猜测他会怎么做时,你需要非常小心。你不是他,也永远不知道什么会让他做出反应,以及为什么会做出反应。很难甚至不太可能

    去预测别人在一定情况下会如何反应。

    当然,我有足够的例子来阐明我的观点。我随机挑选了一些。2006年,格里

    戈里·佩雷尔曼教授婉拒了菲尔兹奖(相当于数学家的诺贝尔奖),他说:“我对

    金钱和名声都不感兴趣。”2010年,他因为证明了庞加莱猜想(Poincaré

    conjecture)而获得100万美元的奖金,但他再次拒绝领取奖金。你看,有些人不

    喜欢钱。在第二次世界大战期间,约瑟夫·斯大林拒绝了一个战俘交换提议:即用

    苏联人在斯大林战役中逮捕的一名德国司令官换取他自己的儿子雅科夫·朱加什维

    利,后者自1941年起就被德国人俘虏。“我不会用一名将军交换一名士兵。”斯大

    林宣称。与此同时,也有一些人把自己的肾脏捐给了完全不认识的人。为什么

    呢?你的猜测和我差不多。弗拉基米尔·普京一天早上醒来,决定了克里米亚半岛

    的未来。我甚至还没来得及开始猜测这个决定。

    事件发生之后,一些政治大腕为普京的行为给出了巧妙的解释(你可以上网

    搜一下)。但唯一的问题在于他们没人预测到这一举动,这足以证明他们对普京

    的思维方式毫无概念。

    现在,最重要的见解如下。

    5.虽然学习博弈论模型很重要也很有帮助,但我们必须记住,通常情况下,生活中的真实事件比它们最初看起来要复杂得多(当我们第二次和第三次审视它

    们时,它们并没有变得更加简单),没有数学模型能够捕捉到它们整体和全部范

    围的复杂性。数学更适合研究自然的规律,而非人类的本性。即使我们不完全了解事实,进行谈判也是我们生活中的必要成分。我们同配

    偶、孩子、合作伙伴、老板以及下属都会谈判。当然,谈判也是国家间外交关系

    或政治机构行为(如组建联盟时)的基石。因此,当发现不仅仅是普通人,连那

    些重要的政治人物和经济人物有时也会表现出十分拙劣的谈判技巧和谈判哲学

    时,这不能不让人感到惊讶。

    在下一章中,我们将读到一个与谈判有关的著名博弈。第三章 最后通牒博弈

    在这一章中,我会着重谈一项经济学实验。这项实验对人类行为进行洞察,动摇了标准的经济学假设,表明人类不愿接受不公正,并清楚地显示经济人

    (Homo economicus)与真正的人之间的巨大差异。我们也会研究在一个重复出

    现的最后通牒博弈版本中不同的谈判策略。

    1982年,德国科学家维尔纳·居特(Werner Güth)、罗尔夫·施密特伯格

    (Rolf Schmittberger)和贝恩德·施瓦策(Bernd Schwarz)就他们进行的一项实验

    撰写了一篇文章。这项实验的结果让经济学家(仅仅是经济学家而已)很是惊

    讶。这项被称为最后通牒博弈的实验自此成为世界上最著名也是研究最多的博弈

    实验之一。

    这个博弈类似于勒索者悖论,但有着非常关键的不同。最主要的不同是最后

    通牒博弈的非对称性。

    博弈是这样进行的。两位互不相识的博弈者处于同一个房间内。我们姑且称

    他们为莫里斯和鲍里斯。鲍里斯(让我们称他为提议者)获得了1000美元,并要

    求用他认为合适的方式与莫里斯(让我们称他为回应者)分享。这里唯一的条件

    是回应者必须同意提议者的分配方式:如果他不同意,这1000美元就会被拿走,两位博弈者将一无所获。请注意,参与游戏的两位博弈者充分了解情况。这样,如果鲍里斯给莫里斯10美元,而且莫里斯也同意,那么鲍里斯将拿走990美元。

    但是,如果莫里斯对这一提议不满意(他知道鲍里斯有1000美元),那么他们两

    人都会空手而归。你认为会发生什么?莫里斯会接受鲍里斯10美元“慷慨”的提议

    吗?如果你参加这个博弈,你会提议多少?为什么?如果你是一个回应者,你能

    接受的最少数额是多少?为什么?

    数学vs心理学

    我相信这个博弈会指向一个巨大的张力,这个张力经常存在于基于数学原则的决定(“标准”决定)和基于直观原则和心理学的决定(“积极”决定)之间。

    从数学角度看,这个博弈很容易解决,但是美好而简单的解决办法并不一定

    是明智的。如果鲍里斯希望使他的个人收益最大化,他应当提议1美元(假设博

    弈的最小单位是美元,不是美分)。面对这样一个提议,莫里斯面临着莎士比亚

    的困境:“拿还是不拿,这是个问题。”如果莫里斯是一个普通的经济、数学和统

    计学人——数学爱好者和坚定的理性主义者——他会问自己一个问题:“哪个更

    多,1美元还是0美元?”很快,他会想起自己的幼儿园老师曾经说过,“一个总比

    没有强”。于是他会拿走这1美元,给鲍里斯留下999美元。但是,真正的博弈永远

    不会这样进行。如果莫里斯只接受这1美元,这确实不合逻辑,除非他确实很爱

    戴鲍里斯,希望成为他的恩人。更有可能的情况是,这个提议会惹恼甚至侮辱莫

    里斯。毕竟,莫里斯不是那样一个极端的理性主义者。他有着人类的情感,例如

    生气、诚实、嫉妒等。知道这些后,你认为鲍里斯会如何提议,从而实现整个交

    易?

    我们也可能会问,为什么一些人仅仅因为听说或坚持认为自己知道对方会拿

    到的数额,就拒绝接受向他们提议的数额——有时也会是很大的数额。我们如何

    将侮辱也作为因素计入数学计算中?如何量化侮辱?人们愿意放弃多少以避免感

    觉被人当成傻子?

    这个博弈曾在不同地方试验过,包括美国、日本、印度尼西亚、蒙古、孟加

    拉国和以色列。这类博弈不仅涉及金钱的分配,还包括珠宝(在巴布亚新几内

    亚)和糖果(当小朋友参加游戏时)。经济学学生和佛教的冥想者,甚至黑猩猩

    也都参加过这场博弈。

    我总觉得这个博弈有着无法抗拒的吸引力,并用它做了好几次实验。在很多

    现实生活的情境中,我看到人们拒绝了侮辱性的提议,如很多人拒绝接受低于总

    数额20%的提议(这是在很多不同文化中都观察到的现象)。当然,这个20%的

    界限仅仅适用于博弈金额相对较小的情况。这里的“相对”非常重要。我是说,如

    果比尔·盖茨提议给我他全部财产的哪怕0.01%,我也不会觉得被冒犯。

    跟往常一样,没什么事情很简单,也没有什么明确的结论等着我们。例如,在印度尼西亚,博弈者获得了100美元——这在他们那里是相对较大的数额——

    然而一些博弈者却拒绝了30美元的提议(相当于两周的工资)。是的,人都很奇怪,但有些人比大多数人都奇怪,甚至超出了我们的预期。在以色列,我们也看

    到有人对从500新谢克尔的总额中分到150新谢克尔的提议感到不满意:在150和0

    之间做出选择,他们的选择是0。这看起来像是一个伟大的时刻,揭示了近来关

    于价值的一个伟大发现:150比0要大。既然如此,为什么人们会做出上述选择?

    回应者知道提议者留下了350新谢克尔,而不愿意接受这个现状,认为这极不公

    平且具有侮辱性。一分也不接受对他的神经更好。在过去,数学家对人们的正义

    感没有给予足够的重视。现在,他们对此重视了。

    最后通牒博弈从社会学家的角度来看很迷人,因为它说明人类不愿意接受不

    公正,同时强调荣誉的重要性。宾夕法尼亚大学的心理学家和人类学家弗朗西斯

    科·吉尔-怀特(Francisco Gil-White)发现,在蒙古的一些小型社区,提议者倾向

    于提议数额平分,无论他们是否知道非均匀的分配几乎总是会被接受。或许好的

    声誉比经济奖励更有价值。

    “美名胜过美好的膏油。”

    ——《传道书》7:1

    无知是福

    顺便说一句,如果回应者事先不知道提议者最后会留下多少钱,那些奇怪的

    行为(在一次性的匿名博弈中拒绝大量金钱)都不会发生。因此,知道得多并不

    总是优势。如果我提议你接受100美元,不给你其他任何信息(不告诉你如果你

    接受了我的提议,我就会得到900美元),你很有可能会拿上这笔钱,给自己买

    点好东西。《传道书》里提到,“因为智慧多,所以愁烦就多有”(1:18),这是

    很有道理的。同样,以色列作家阿摩司·奥兹提到他曾经看过一部美国动画片,里

    面有一只猫一直往前跑,直到抵达了一个深渊边缘。那只猫是怎么做的呢?如果

    你看过动画片《猫和老鼠》,你就会知道答案:那只猫没有停下来。它会在空中

    继续跑,然后在一个很关键的时刻,它意识到自己正悬在空中,而只有在那时,这只猫才会像一块石头一样掉下去。那么是什么让它突然掉下去的呢?答案是:

    知识。如果这只猫不知道自己的爪子下并没有支撑,它就会在空中一直往前走,直到中国。那么,我们该怎么进行这个博弈呢?最佳提议会是什么?当然,这取决于许

    多变量——包括我自身对冒险欲望的限度。显然,没有一个统一的答案,因为这

    是一件相对个人的事情。此刻,另一个重要的问题是关于这个博弈进行的次数。

    在一次性的博弈中,最合理的策略是我们把对方给的都拿走(除非我们觉得这样

    实在太受欺负),可以买一本书、看场电影、吃个三明治、买顶漂亮的帽子,或

    做点慈善——有总比没有好。但是,如果这个最后通牒博弈重复出现,故事就会

    完全不同。

    虚假的威胁和真实的信号

    在重复出现的最后通牒博弈中,拒绝大笔金额其实是有道理的。为什么?给

    对方一个教训,并发出一个清晰的信号:“我没有那么廉价。看,你提议给我20美

    元,我拒绝了你。下一次,你最好改进你的出价。我甚至会建议你考虑平分,否

    则你会一无所得。”但是,任何事情都不会像看起来那么简单。如果回应者在第一

    轮拒绝了200美元,那么接下来提议者会提议多少?在这种情况下,需要考虑几

    种可能的反应。

    一种方案是,为了不让回应者生气,提议者应在第二轮一开始就给出500美

    元。毕竟,他已经毁掉了一次交易,如果再这样就会丢脸了。问题是,一次性从

    200美元涨到500美元,会让提议者显得很弱。回应者可以通过再次拒绝提议,从

    而试图压榨出更多的钱,他会想,他这次什么都不要,但可以强迫提议者在未来

    几轮给他600美元、700美元,甚至800美元。

    另一个可能的解决方案(普京的做法)是往相反的方向走。如果回应者拒绝

    了200美元的提议,提议者应给190美元。这样做的逻辑何在?这样的举动是向回

    应者发出信号:“你想来点狠的?我只会更狠。你拒绝一次出价,我就会少给你10

    美元。我经济立场坚定,你大可以拒绝我的出价,直到你气得脸色铁青。你会损

    失更多,而我一点也不在乎。”

    在这种情况下,回应者应采取什么策略?如果他认为,提议者确实很强硬,也许他会妥协。然而,表面上的冷酷也许只是一种虚假的威胁,所以……现在我

    们有一个问题,因为我们做的正是心理和大脑的博弈。心理学和数学完全不同,它没有什么确定的事。

    不管怎样,一次性博弈和重复博弈应该被区别对待,而且博弈者应采取不同

    的策略。但在一些情况下,参与者拒绝大的数额,是因为他们不知道这个博弈只

    玩一次,因此给对方发出信号没有意义:虽然提议者可能掌握了线索,但回应者

    永远也不会从这个学习曲线中受益,因为不会再有下一轮博弈了。通常(我不得

    不反复强调),事情不会像看起来那么简单。

    粉饰的乐趣

    2006年9月,我在哈佛大学举办了一场博弈论的研讨会。一位参加研讨会的

    科学家告诉我,最近得知,一部分在一次性最后通牒博弈中拒绝高获利提议的人

    是出于生物和化学的原因才这么做的。当我们拒绝不公正的提议时,我们的腺体

    会分泌出大量的多巴胺,产生出一种类似于性快感的效果。换句话说,惩罚不公

    平的对手是一种极大的乐趣。当我们如此享受拒绝时,谁还会想要这区区200美

    元呢?

    男人、女人、美和信号

    陀思妥耶夫斯基曾说:“美将拯救世界。”我不太了解这个世界,但美在最后

    通牒博弈中到底有多重要呢?(即使从经济角度看,美也是很迷人的。例如,美

    丽溢价,长得好看的人们比那些没那么美的同事挣得要多,这是一个众所周知的

    事实。)

    1999年,马利斯·施韦泽(Maurice Schweitzer)和萨拉·索尔尼克(Sara

    Solnik)研究了美貌在最后通牒博弈中的影响。在游戏中异性互为提议者和回应

    者。这是一次性博弈,涉及金额为10美元,而且在游戏开始时,两组队员都要为

    对方队员的颜值打分。结果是男性对长得漂亮的女性并没有慷慨(这让人有些惊

    讶),但女性却向吸引她的男性给予更多。有些人甚至从分配的10美元中拿出了

    8美元给对方。事实上,这是我们所知的在西方世界里进行的唯一一次平均的提议金额超过总金额一半的实验。我们能对此做出什么解释呢?我想,虽然他们被

    清楚地告知这是一次性的博弈,但这些女性想到的是重复进行的博弈。尽管男性

    不太善于理解暗示,但他们能理解“一面之交”的含义。显然,这些女人试图向这

    些美男子发出信号。“看,我给了你我的全部。一会儿你何不请我喝杯咖啡

    呢?”她们实际试图将这一次性的游戏发展成为“连续剧”。那位优秀的作家简·奥

    斯汀曾一语道破,她说:“一位女士的想象力是非常迅速的,它能在一瞬间从仰慕

    变成爱慕,从爱慕变成婚姻。”

    我相信,一旦跨出博弈的界限,女性参与者在战略性和创造性方面比男性参

    与者更有优势。女性对其行为产生的长期后果的关注是决策过程中一个重要且很

    受欢迎的品质。因此,彼得森国际经济研究所最近的一项研究指出有着更多女性

    领导者的公司更能产生盈利,也就不足为奇了。性别平等不仅仅关乎公平,它同

    时也是改进经营业绩的关键。

    法院最后通牒

    一个在法院环境下进行最后通牒博弈的例子是“强制许可”案例。当有人提出

    原创的新点子时,他或她会将此注册为专利,事实上就是一个受到许可的垄断。

    也就是说,专利拥有人可以阻止其他任何人使用他们的发明。虽然法律创设这条

    是为了鼓励人们通过创新和改革来对社会做出贡献,但事实上这种垄断很可能会

    被不希望其他人使用专利的专利所有者滥用,要不然就为授权许可收取大量费用

    ——特别是当这个产品可能会获得广泛使用的时候。[最近,图灵制药公司的首

    席执行官马丁·什克雷利推高了一种被称为达拉匹林(Daraprim)的药物的价格。

    这种药物是普遍用于治疗艾滋病的抗寄生虫药物,从最初的每粒13.50美元一夜之

    间涨到每粒750美元。]在这类案例中,想使用这一专利的人可能要求法院给予

    他们强制许可,即无须首先获得发明者的允许。那些担心其他人会获得强制许可

    的发明者不会定出不合理的价格,他们将寻求一项协议,有可能无法获得曾经想

    从发明中获得的全部利润,但他们依然保有许可。就像在最后通牒博弈中的博弈

    者一样,发明者必须记住,有的时候你不得不做出妥协,虽然获得较少的收益,但有总比没有强。当事实和数学合二为一

    在最后通牒博弈的另一个版本中,有几位提议者提出了分配博弈金额的几种

    方法,而唯一的回应者可能会选择其中的一个方案,让其余的人都接受这种方

    案。在这里,事实与数学合二为一。在数学解决方案中,提议者提出将全部的金

    额都拿出来,因为这就是纳什均衡(我们之后会谈到这个,但简言之就是如果博

    弈金额是100美元,并且有一位提议者提出这个金额,那么其他金额少的提议者

    都不会有好的结果,因为回应者很自然会拒绝)。事实上,提议者希望自己的提

    议被选上,但同时担心其他提议者会给出更高的金额,这使提议者都倾向于给回

    应者几乎全部的金额。

    独裁者博弈

    这是最后通牒博弈的另一个版本。这里只有两位博弈者,提议者也被称为“独

    裁者”,拥有完全的控制权,而回应者必须接受独裁者提出的任何条件,事实上他

    是一个“徒劳的”博弈者。根据数学解决方法,提议者应当拿走全部的游戏金额。

    正如你肯定已经猜到的那样,标准的经济假设是对实际行为不准确的预测。通常

    情况下,“独裁者”并没有拿走全部的金额:他倾向于将一些钱(有时候他会给出

    很可观的金额,有时候他会平分金额)给回应者。他为什么会这样做?这能告诉

    我们关于人性的什么呢?这与利他主义、公平和自尊有何关系吗?你应该和我猜

    的一样。第四章 人们参与的博弈

    在这一章中,我们会学一些既有趣又有启发性的博弈。我们会扩展我们的博

    弈词汇,获得一些启发,并改进我们的战略技能。与此同时,我们还会认识一些

    我认为可被称为“年度战略家”的人。让我们开始吧。

    博弈一 海盗博弈

    “你应该相信‘不可信赖’,因为你总能发现人们将是不可信赖的。所

    谓‘值得信赖’才是你最不能相信的。”

    ——杰克·斯帕罗船长,《加勒比海盗》

    一群海盗在经历了海上艰难的一天后回到家乡,他们带回来100枚达布隆

    币[1]

    (以下简称金币),需要在五个海盗头子之间进行分配。他们分别是亚伯、本、卡尔、唐和埃尔恩。亚伯是最大的头目,而埃尔恩是他们中间地位最低下

    的。

    尽管这里存在等级制度,但这个团队还是民主的,因此他们就分赃达成以下

    原则。亚伯提议了某个分配方案,然后所有海盗(包括亚伯本人)就此进行投

    票。如果这个方案获得大部分海盗的支持,他们就会执行亚伯的提议,博弈结

    束。如果得不到大家的支持,亚伯就会被扔进大海(即使民主的海盗也是很难受

    控制的)。如果亚伯不在了,就轮到本提出方案。他们再次投票。注意,现在有

    可能形成平局。我们假设在投票平局的情况下,提议将被放弃,而提议者将被扔

    进大海(但还有一个版本,即在平局情况下,提议者拥有决定性一票)。如果本

    的提议获得大多数海盗的支持,那么他的方案将获得执行。否则,他会被扔进大

    海,卡尔会面对越来越少的海盗提出一个方案。以此类推。

    这个博弈将一直继续,直到某个建议被大多数海盗投票接受。如果这个情况

    也没出现,那么埃尔恩会是最后一名活着的海盗,并拿走全部的100枚金币。在你继续读下去之前,请停下来想一想这个博弈将如何结束,假设所有的海

    盗都很贪婪且聪明。

    数学解决方案

    数学家通过逆向归纳法(backward induction)来解决这类问题,从结果倒推

    至开头。假设现在亚伯给出方案并且失败了,本的提议被拒绝而他本人也不在

    了,卡尔也没能做得更好。唐和埃尔恩是仅存的两名海盗,现在的解决方案相当

    明显:唐必须建议埃尔恩拿走100枚金币,否则唐很有可能落得在海里和鲨鱼共

    舞的结局(请记住投票平局也意味着提议者失败),而且不可能存活多久。唐是

    一个聪明的海盗,他建议埃尔恩拿走全部金币(见表4-1)。

    表4-1 唐的金币分配方案

    海盗卡尔也一样聪明,他知道上述情况将是游戏的最后阶段(如果能持续到

    这一步的话,而这正是卡尔希望尽全力避免的)。此外,卡尔知道他没有什么可

    以给埃尔恩的,因为埃尔恩的利益就是不管怎样都要努力进入下一阶段。然而,相比最后只剩下唐和埃尔恩时唐所面临的情况,卡尔可以帮助唐改善他的处境,并且可以通过给他一枚金币来让唐投票支持他(在这种情况下,唐会支持卡尔,他们将成为多数)。于是,当还剩三个玩家时,金币的分配是卡尔99枚,唐1

    枚,埃尔恩0枚(见表4-2)。

    表4-2 卡尔的金币分配方案

    本自然知道这些算计。他知道他没有办法提出改善卡尔处境的建议,但他可

    以给唐和埃尔恩提出他们无法拒绝的方案,即卡尔分文没有,埃尔恩有1枚金币,唐有2枚金币,本得到剩下的97枚金币(见表4-3)。

    表4-3 本的金币分配方案

    现在我们能够清楚看到亚伯应该怎么做(作为最资深的海盗,他对分赃这类

    事情很有经验)。亚伯提出以下建议(见表4-4)。他拿走97枚金币,一枚也不给

    本(他在任何情况下都不会被收买);给卡尔1枚金币(这种情况还是要比亚伯

    被扔进大海,本分配金币好);唐什么也得不到;埃尔恩会得到2枚金币(唐的

    投票权比埃尔恩的要便宜一点)。这个方案将以3∶2的形式投票通过。这些海盗

    将在海上继续抢劫,直到海枯石烂。

    表4-4 亚伯的金币分配方案

    这最后的分配看起来有些奇怪。如果我们请五个数学系的学生来做这个实

    验,是否会得出同样的结论?如果是请心理学系的研究生来做这个实验呢?心理

    学家又是如何处理各种可能性的呢?

    参与者能否结成联盟并达成协议?如果能,这个博弈看起来会如何?数学解

    决方案总是假设所有的玩家都聪明且理性,但这一假设本身是否聪明呢?又是否

    理性?我观察了这个博弈很多次,从未见过参与者达成数学解决方案。这意味着

    什么?数学解决方案忽视了如嫉妒、屈辱感或幸灾乐祸这类重要的情绪。情感因

    素能否改变数学计算?

    海盗博弈事实上是最后通牒博弈的多人博弈版本。如果你觉得这个博弈很奇

    怪,那么你会怎么看以下博弈?博弈二 死去的富人

    一位非常富有的老人去世了,留下两个儿子:萨姆和戴夫。[2]

    兄弟俩合不

    来,他们已经有10年没有见过面或是说过话。现在他们在自己父亲家中相聚,聆

    听父亲的遗愿和遗嘱。

    父亲的律师打开信封,念出了这份独特的遗嘱。这位父亲留给他的两个儿子

    1010000美元的遗产,以及可能的分配结果。

    在第一个分配方案(见表4-5)中,哥哥萨姆可以立即拿走100美元,给弟弟

    留下1美元,再将剩下的遗产全部捐给慈善机构(这将是一大笔善款)。

    表4-5 第一个分配方案

    萨姆没有义务一定要接受这个方案,而且可以将难题留给他的弟弟戴夫。如

    果由戴夫来处理这笔钱,他可以拿走1000美元,萨姆得到10美元,剩下的捐给慈

    善机构。这是第二个分配方案(见表4-6)。

    表4-6 第二个分配方案

    但是现在应由戴夫决定是否拒绝。他可能会给萨姆机会,来决定是否有另一

    个更好的分配方案,即萨姆拿走1万美元,给戴夫100美元,剩下的钱捐给慈善机

    构(见表4-7)。

    表4-7 第三个分配方案然而,萨姆不必接受这个选项,他可能将难题再留给戴夫,而这一次戴夫可

    能自己拿10万美元,给萨姆1000美元,而捐给慈善的部分不断缩水(见表4-8)。

    表4-8 第四个分配方案

    当然,这个并不是最终结果。戴夫可能决定让萨姆再次分配这笔钱,但分配

    方式如下:自己拿100万美元,给他讨厌的弟弟1万美元,一分钱也不捐给慈善机

    构(见表4-9)。

    表4-9 第五个分配方案

    那么,你认为现在会发生什么?同样,这个问题也可以通过逆向归纳法来解

    决。每个人都能看出,这个博弈绝不可能持续到最后一个(第五个分配方案),即戴夫让萨姆拿走100万美元,因为这将使他自己的收益从10万美元降到1万美

    元。萨姆知道这一点,因此,他不会让这个博弈采用第四个分配方案,那时萨姆

    只能拿到1000美元,而不是第三个分配方案的10万美元。现在继续分析,能看到

    他们也不会采用第三个分配方案……也不会采用第二个分配方案。这很让人吃

    惊,但假设兄弟俩都是同一种类别即理性经济人(也就是他们都是精于算计、只

    知道照顾自己的人),这个博弈在提出第一个分配方案就会结束,其中萨姆拿到

    100美元,给戴夫1美元,剩下大部分的钱捐给慈善机构(不良的用意也可能导致

    慷慨的结果,兄弟俩没准会得到神圣的奖励)。这是数学解决方案,萨姆有100

    美元,戴夫1美元,大部分钱捐给慈善机构。这个解决方案到底符不符合逻辑?由你来判断。

    博弈三 巧克力和毒药博弈

    这是一个相当简单的游戏,也被称为“巧毒博弈”。我在这里用的“巧毒博

    弈”的规则应感谢已故的美国数学家大卫·盖尔(David Gale)。这个博弈在一个方

    格棋盘上进行,棋盘上每一块方格都由巧克力做成,但左下角的一块方格含有一

    剂毒药。规则如下。

    开局的玩家在任意一块方格上标明X(见图4-1)。

    图4-1 巧毒博弈①

    一经选择,标上X的方格的右方和上方的全部方格都会自动标上X(见图4-

    2)。图4-2 巧毒博弈②

    接下来,由另一位玩家在剩下的方格中任选一个标上O。标注后,这个方格

    右方和上方的方格也会自动标上O(见图4-3)。

    图4-3 巧毒博弈③

    之后,第一个玩家在另一个方格上标上X,使这个方格及其右方和上方的方

    格(如果还有的话)也变成X。之后第二个玩家再在一个方格上标上O,所有在其

    右方和上方的方格(如果还有的话)也变成O。这个游戏不断进行下去,直到其

    中一个玩家因被迫选择毒药而输了博弈并“死去”才结束。

    你可以在7×4(7行4列,或4行7列)的棋盘上玩这个游戏。

    如果游戏是在一个正方形(行与列的数量一样)的木板上进行,那么这里有

    一个策略可以让那个开局的玩家永远是赢家。你发现了吗?花上三分钟时间思考

    一下。解决方案:让我们假设琼和吉尔在玩这个游戏。如果琼是开局的玩家,她应

    坚持以下策略直到成功。第一步,她应选择毒药右上方斜对角的方格(见图4-

    4)。

    图4-4 巧毒博弈④

    现在她需要做的就是对称地跟随她的对手:也就是说,她会和吉尔选择同样

    的方格,只是在棋盘的对侧。图4-5可以更好地说明。

    现在如何赢得这场博弈已经显而易见了。

    如果这个博弈在一个长方形的棋盘上进行,情况就会变得复杂得多。但我们

    仍然可以证明,开局的玩家依旧拥有获胜的策略。问题是我们的证据并没有详细

    说明这个获胜的策略。数学家将这类证据称为“非构造性存在证明”。图4-5 巧毒博弈⑤

    博弈四 不适合老年人的游戏

    我在我的家乡立陶宛维尔纽斯的初中里,学到的最宝贵的技能之一,就是上

    课时在纸上玩战略游戏而不被老师发现。我很喜欢三连棋游戏(也叫拼字游戏)

    的“无限”版本。这个游戏让我熬过了那些枯燥无味的课堂。

    我想我们大多数人都熟悉三连棋游戏的经典版本,就是在3×3的方格上进

    行,这对6岁以内的孩子来说非常有吸引力。大一点的孩子(以及成年人)通常

    打成平手,除非一个玩家在游戏过程中睡着了(这也说得过去,毕竟这是个无聊

    的游戏)。

    然而,在“无限”版本中,这个游戏的棋盘有无数的格子,而游戏目标是创造

    出连续的5个X或者O,而且和原来的版本一样,方向可以是垂直、水平或者对

    角。玩家轮流用X或者O来标注格子(按照事先约定),而最先完成五连棋的玩家

    获胜(见图4-6)。图4-6 “无限”版本三连棋

    在图4-6的左侧,X玩家已经获胜。

    在图4-6的右侧,虽然轮到O玩家下棋,但他仍然无法阻止X玩家获胜。你知

    道为什么吗?

    当时在学校,我曾以为自己发明了这个游戏,但没过多久我就意识到并不是

    这样。我发现,在日本和越南有一个风靡多年的游戏同这个很像,那个游戏叫五

    子棋(Gomoku)。Go在日文中就是五。虽然五子棋和围棋可以用同样的棋盘,但这两种游戏是不相关的。围棋是一种古老的中国游戏,孔子在《论语》中曾有

    提及,但后来被日本人介绍到西方,因此大家只知道它的日语名字。

    虽然我拥有在课堂和课间(课间玩棋意思不大,因为本来这个时间就可以

    玩)玩三连棋游戏“无限”版本的大量经验,但是我仍然不确定先下棋的棋手(X

    棋手)拥有最优获胜战略,也不确定如果两个高手对弈,将总是平局(或者事实

    上永远结束不了)。然而,我愿意打赌说一定存在获胜战略。当我将来退休并有

    了充足的时间后,我会试着为先下棋的棋手找出获胜战略。当然,老实说,我已

    经几十年没有玩这个游戏了。只是在写本书的时候,我才回忆起来。鉴于我重新

    研究这个游戏战略部分的计划还比较久远,你们可以先开始研究,找出这个战

    略,为我省下时间和精力。 (本书分享更多索搜@雅书)

    博弈五 信封的反面往往更绿想象以下场景。我的面前有两个装有现金的信封,我被告知其中一个里面的

    现金是另一个的两倍。我可以任选一个拿走。这听起来像是世界上最简单的博弈

    了。我怎么可能输呢?

    假设我选了一个信封,打开,发现里面有1000美元。我一开始还挺高兴,但

    之后我开始想另一个信封里的内容——我没有选中的那个。当然,我不知道里面

    有什么。它可能是2000美元,这意味着我做了糟糕的选择,但它也有可能是500

    美元。经过思考后,我得出以下结论:“我不高兴,因为我没选的那个信封里的潜

    在金额的平均值比我现在拿到的钱要多。毕竟,如果它里面有2000美元和500美

    元的概率是均等的,因此,平均值是1250美元,这比1000美元要多。我自己算得

    出来!”

    事实上,我从信封里无论拿到什么都能证明墨菲定律,即“会出错的事情总会

    出错”。平均来看,没有选中的信封会永远比我选中的要好。如果我的信封里面有

    400美元,那另一个里面可能有800美元或200美元,平均值就是500美元。如果这

    样想,我永远不可能选对。没选上的收益将比我的收益永远高出25%。所以,如

    果我在检查另一个信封内容之前再次面临这个选择,我会改变主意吗?如果我那

    样做,我会进入一个永不停歇的循环。为什么一个如此简单的选择会变得这么复

    杂?

    事实上,刚才我给你讲的故事也是一个知名的悖论,它最早是由比利时数学

    家莫里斯·克莱特契克(Maurice Kraitchik,1882—1957)提出的,只不过他讲的

    是关于领带的故事。两个男人争论谁的领带更好看。他们找到第三个人——比利

    时著名的领带专家——作为裁判。这位专家答应了,但提出一个条件,赢的人需

    要将他的领带作为安慰奖送给输的人。这两位领带主人简单考虑了一下并同意了

    这个提议,因为他们都这样想:“我不知道我的领带是不是更好。不管怎样,如果

    我赢了,那我会输掉我的领带,但如果我输了,我会赢一条比我自己更好的领

    带。所以这个赌博对我有利。”两个竞争者怎么能够相信他们都占优势呢?

    1953年,克莱特契克给出了这个故事的另一个版本,涉及另外两个好争论的

    比利时人。他们不戴领带,因为他们吃了太多的比利时巧克力,以至于领带让他

    们感到无法呼吸。他们就用钱包里的东西相互挑战,并决定他们中间更富裕和更

    开心的那位应将自己的钱包给对方。如果他们不分胜负,那就回去继续吃巧克

    力。同样,他们都相信自己占有优势。如果他们输了,拿到的奖金会比自己赢时

    给出的赌注多。这是一个好的游戏吗?你可以试试和大街上的陌生人做这个游

    戏,看会发生什么。1982年,马丁·伽德纳在《啊哈!原来如此》一书中使这个故

    事一举成名。这本书是关于智慧思考的最优秀、最简洁和最有趣的著作之一。

    巴里·纳莱巴夫(耶鲁大学管理学教授)是一位重要的博弈论专家,他在自己

    1989年的文章中提供了这个故事的信封版本。

    奇怪的是,即使是在今天,这个博弈也没有一个能让所有统计学家达成一致

    的解决方案。解决提议之一涉及用几何平均而不是算术平均。几何平均数是指两

    个数字乘积的平方根。举例说,4和9的几何平均数是他们乘积(即这两个数字相

    乘)的平方根,也就是6。现在,如果我们在自己的信封里发现有X美元,知道另

    一个信封里会有2X或者X的12,那么另一个信封里的几何平均数将是X,而这正

    好是我们手里美元的数额。使用几何平均数的逻辑就是,我们事实上是在说相乘

    (两倍)而不是相加。如果我们说一个信封比另一个信封里要多10美元,我们会

    使用算术平均数,找出来,得出的结果毫无矛盾,因为如果我们的信封里有X美

    元,而另一个里面有X+10或者X-10,那么没有选上的信封里的算术平均数是X。

    那些学过概率课的学生会说,你“不能均匀分配一组有理数”。这听起来是不

    是让人印象深刻呀?

    如果你不能理解这意味着什么,也完全没问题,因为这个悖论的最佳版本与

    概率没有任何关系。这最后的版本在美国数学家、哲学家、古典钢琴家和音乐家

    雷蒙德·M.斯穆里安的精彩著作《撒旦、康托和无穷》(Satan,Cantor and

    Infinity)中出现了。斯穆里安展现了这一悖论的两种版本。

    1.如果在你的信封里有B张纸币,那么你会得到B,或者将你的信封替换成另

    一个信封,你会得到B的12。因此,你应该换过来。

    2.如果两个信封里分别装有C和2C金额的钱数,而且你选择用一个换另一

    个,那么你会要么得到C,要么失去C,因此你得与失的概率是平均的。

    困惑吗?其实我也困惑。

    无论怎么样,很多保持悲观的人认为这里不存在悖论,这就是生活,无论你做什么或是去哪里,有不同的选择总会更好。例如,如果你结婚了,或许你认为

    自己应该单身。毕竟,安东·契诃夫写过:“如果你害怕孤独,请不要结婚。”但

    是,如果你因此选择单身,你又错了。圣经中第一次出现“不好”这个表述是在

    《创世记》(2:18),其中说:“这个人独居不好。”上帝都这么说了,不是我说

    的。

    博弈六 金球

    《金球》(Golden Balls)是一个英国的电视游戏节目,2007—2009年播出。

    我们不会详细探讨游戏的规则和步骤,但在游戏的最后一步,会剩下两个玩家商

    量如何在他们之间分一定数量的钱。每个玩家都有两只贴有标签的球,一只球标

    着“分”,另一只标着“偷”。如果他们都选择“偷”这只球,那两人最终什么也得不

    到。如果他们选的球不一样,那么选那个标着“偷”的球的人会拿走奖金。玩家可

    以在选择之前讨论一下他们的处境。

    表4-10 金球游戏

    根据游戏规则,我们做出了表4-10。简单看一眼就明白,如果每个玩家只考

    虑自己的收益,那么选“偷”比选“分”好。问题在于,如果两个玩家都这么做,那

    么二者皆输。(是的,这和你也许已经知道的囚徒困境很相似。我们稍后会讨论

    这个著名的困境。)

    在大多数情况下,玩家会说服彼此选择“分”,这种办法有时候是有用的。

    YouTube(优兔)视频网站上有很多关于这个游戏的视频,其中会展示不少让人

    伤心的场面,一些游戏玩家信任他们的对手而选择了“分”,但结果发现他们上当

    了。

    一天,一位名为尼克的玩家提出一个与众不同的方法。尼克告诉他的对手易卜拉欣,他会选择“偷”,并乞求易卜拉欣选择“分”,承诺在游戏结束后他会平分

    得到的奖金(这期奖金为13600英镑)。易卜拉欣不相信自己听到的。尼克反复

    承诺他会作弊,同时坚持说他提前说出来则表明他基本的诚信。易卜拉欣应相信

    自己能得到另外一半的钱。“你选‘分’不会损失什么,”尼克告诉他,“你只会获

    益。”在那一刻,玩家被要求停止谈话并拿起所选的球。

    易卜拉欣选了“分”,但尼克也选择了“分”。他为什么这么做?尼克非常确信

    他能说服易卜拉欣与他合作并选择“分”,给他留下在游戏结束后分钱的麻烦。

    你不得不承认,尼克或许能获得“年度最佳战略家”称号。

    这个游戏不仅关系到谈判战略,也关系到玩家间的信任。

    博弈七 错综复杂的棋类游戏

    以下博弈仅适用于下棋和数学爱好者。

    很多人认为博弈论诞生于1944年,即规范书籍《博弈论与经济行为》出版之

    时。这部书的作者是美国伟大的匈牙利裔数学家约翰·冯·诺依曼(1903—1957)

    和经济学家奥斯卡·摩根斯特恩(1902—1977)。(但博弈论解决的问题可以说是

    自古就有。我们可以在《塔木德》《孙子兵法》,以及柏拉图的作品中找到。)

    然而,一些人认为博弈论自德国数学家恩斯特·策梅洛(1871—1953)在1913年提

    出下棋定理“国王博弈”时就已形成,“要么白方有必胜之策略,要么黑方有必胜之

    策略,要么双方也有必不败之策略”。也就是说,他指出只有三种选项。

    1.白方有一种策略,一旦遵循,它总是获胜。

    2.黑方有一种策略,一旦遵循,它总是获胜。

    3.黑方和白方有一套策略组合,一旦遵循,双方总是打成平局。

    当最早读到这个定理时,我记得当时在想:“噢,这可真聪明……真新鲜……

    这位德国思想家告诉我们要么白棋会赢,要么黑棋会赢,或者他们的游戏会打成

    平局。而我呢,还在想是不是会有更多其他的选项……”只有当我开始读他的论证时,我才理解这个定理到底是讲什么的。

    事实上,策梅洛证明了国际象棋游戏与有限(3×3)井字棋没有什么不同。

    正如此前提到,如果井字棋的两位玩家没有暂时精神错乱(有时候确实会发

    生),所有的游戏总是会打成平局。没有其他的选项。即使一开始不断失败的玩

    家,最终也会找到一种不败的办法,这使这个已经很无趣的井字棋游戏变得和读

    一本字体不变的书一样枯燥。

    策梅洛试图证明国际象棋(以及其他博弈)和井字棋几乎一模一样,它们只

    有着数量上,而非性质上的不同。

    在国际象棋中,“策略”是对可能在棋盘上具体化的任何情境做出的一套反

    应。显然,两个棋手之间会有大量的策略。让我们将白方(第一棋手)的策略标

    上S,而将其对手的标上T。正如策梅洛定理指出的那样,只存在三种可能性。

    要么白方有一种策略(我们姑且叫S4),用这种策略,无论黑方怎么走,他

    总是能赢(见表4-11)。

    表4-11 国际象棋的白方赢棋策略

    注:W=白方赢,B=黑方赢,X=平局。

    或者黑方也有一种策略(我们称为T3),用这种策略,无论白方怎么走,他

    总是能赢(见表4-12)。

    表4-12 国际象棋的黑方赢棋策略或者双方有一种策略组合,如果遵循这些策略,博弈总会打成平局(正如井

    字棋一样,见表4-13)。

    表4-13 国际象棋的平局策略

    如果真是这样,人们为什么要下棋?为什么还会觉得有意思?事实上,当我

    们下棋或看别人下棋时,我们不知道自己面对的是三种情况中的哪一种。超级电

    脑在未来也许能够给出正确的策略,但我们距离那一步尚远,因此觉得国际象棋

    始终如此有趣。根据美国数学家和密码学家克劳德·香农(公认为“信息理论之

    父”)的计算,国际象棋中变化数量达到10的43次幂。看一下这个数字:

    10000000000000000000000000000000000000000000。很多人认为,计算机用于测

    试国际象棋可能性的时间范围超过了最现代的技术所能达到的时间极限。

    一次我和2012年国际象棋冠军鲍里斯·格尔凡德共进午餐。我告诉他,就在几

    年前,我这样一个差劲的象棋手可以打败电脑程序,但今天电脑可以轻而易举地

    战胜我,这实在让人尴尬。他评论说,人类棋手与电脑棋手的差距越来越大,现在电脑程序可以轻松地打败最强大的人类棋手。这一差距如此之大,以至于人类

    对抗电脑的比赛已经没有任何意义了。在象棋比赛中,人类已经遭受惨败。格尔

    凡德大师最终总结道,如今,人类与强大的电脑程序(也被称为“机器”)对弈就

    如同与一头大灰熊摔跤一样是不明智的。

    人与人之间的对弈则要有趣得多。

    在我们的年代,当象棋大师们对弈时,有时候先走棋的选手会赢,有时候后

    走棋的选手会赢,有时候他们会打成平局。棋手和理论家通常一致认为,先走棋

    的白方会有微弱的优势。统计学家也支持这一观点:白方会比黑方持续多赢那么

    一点,概率约为55%。

    棋手就双方能否有一场全胜的比赛,白方永远赢或是比赛永远平局,已有过

    长时间的辩论。他们认为黑方没有获胜策略[和这一流行的观点相反,匈牙利国

    际象棋大师安德拉什·阿多尔然(András Adorján)认为白方占据优势的观点是一

    种错觉]。

    作为一个退休且不成功的棋手,我的猜测是如果每位棋手都不出错,则比赛

    将永远打成平局(就像井字棋一样)。在未来,电脑会测试所有的相关选项,并

    判断我关于平局的猜测是否正确。

    有趣的是,科学家仍然无法就策梅洛定理达成一致。这个定理的原文是用德

    语写出来的,如果你曾阅读过德文的科学或哲学作品(黑格尔就是一个很好的例

    子),你会对其含义的模糊毫不惊讶(多么幸运,我们当前的科学语言是英

    语)。

    重点 凯恩斯选美大赛

    想象一份假想的报纸正在举办一场比赛,要求参与者从20张照片中选出最吸

    引人的脸蛋。那些选出最受欢迎脸蛋的参与者将获得奖励——终身免费订阅报

    纸、一台咖啡机以及一枚荣誉奖章。

    我们将如何参与这场比赛?让我们假设我们最喜欢的照片是2号。我应该给它投票吗?是——如果我想把自己的观点公之于众。不——如果我想要免费订阅

    报纸、咖啡机和奖章。

    伟大的英国经济学家约翰·梅纳德·凯恩斯(1883—1946)在他的著作《就

    业、利息和货币通论》中的第12章描述了这场比赛的一个版本。他指出,如果我

    们希望得奖,就需要猜出哪张照片会受到大多数读者喜欢,这是复杂性的第一层

    级。但是如果我们想要更加复杂,我们应跳至第二层级,试图猜一下其他参与者

    会认为哪张照片会被别人选为最美脸蛋。正如凯恩斯所说,“我们应将我们的智商

    集中在预测普通人认为的普遍观点是什么”。当然,我们还可以跳至第三层级或者

    更高层级。

    凯恩斯当然不是在说照片,而是在谈论如何在股市里获利,他的观点是类似

    的行为都是有效的。毕竟,若我们因为自己认为一只股票很好,而想买这只股

    票,我们会显得很傻。还不如把这笔钱藏在床垫下或是存起来。股票价值不是在

    它好的时候上涨,而是当足够多的人认为它好的时候,或者是足够多的人认为足

    够多的人相信它好的时候,它才会上涨。

    亚马逊的股票就是一个很好的例子。2001年,亚马逊的股票价值比全美其他

    书商的股票加起来还要高——甚至在亚马逊真正赢利之前。它的股票会涨是因为

    很多人认为,或很多人都相信亚马逊会赢利。

    接下来的游戏就是凯恩斯观点的很好案例。阿兰·勒杜(Alain Ledoux)为使

    此版本流行做了很多努力,并在1981年将其发表在法国杂志《游戏与战略》

    (Jeux et Stratégie)上。

    阿兰·勒杜的猜字游戏

    房间里的一群人被要求每人在0到100之间选一个数字。完成后,游戏组织方

    找出所选数字的平均值,并乘以0.6。结果将是目标数字,选到的数字最接近目标

    数字的人将会赢得一辆奔驰车(它们可以被降价销售)。

    你要选什么数字?稍微花时间想一想。有两种选择的方法:规范法和积极法。

    在规范法版本中,我们会假设其他所有参与者都是聪明且理性的,我们应该

    选0。原因如下。我们假设所有人都随机选择数字,平均值预计将会是50,50×0.6=30,因此要想赢下这场比赛,应当选择30。但请等一下。如果每个人都想

    到这一点了呢?那么平均值就会是30,因此我们应选18(30×0.6的结果)。但如

    果每个人也想到这一点了呢?那么平均值就是18,因此我们应选择10.8(18×0.6

    的结果)。当然,这个故事不会就此结束,如果我们继续按这个方向走下去,最

    终我们会选择0。

    选0的策略就是纳什均衡(我们会在下一章接触到这个非常著名的概念),意味着一旦我们意识到每个人都选择了0,我们没理由不这么做。

    选择0是规范性的建议:也就是说,如果我们相信其他所有人都聪明而且理

    性,这就是一个合理的选择。但如果他们不是这样,我们该怎么做呢?

    这个游戏的积极玩法基于一个事实:要想猜出普通人选择数字的分布是很难

    的,其中心理和直觉所扮演的角色比数学更重要。

    在一些情况下,人们往往不理解这个游戏。例如,一位世界一流大学的教师

    选了95。他为什么这么选?我是说,即使出于一些奇怪的原因,你相信每个人都

    会选择100,这个平均值应当是100,那么可以想象的最高获胜数值将是60。当

    然,当所有其他玩家都选择更加奇怪的策略——选择100时,这个奇怪的选项

    (95)仍然可能获胜。

    一次,一位物理学教授向我解释说,他选100是为了提高平均数值,从而惩

    罚他的那些选择小数字的超级聪明的同事。“他们应当认识到,生活不是一场野

    餐。”

    我本人已经尝试这个游戏超过400次,但仅有一次(在一小群拥有超凡数学

    技巧的孩子中间)发现0获胜。当一组都选择小数字时,就意味着这一组的组员

    比其他组更多地想到了问题,并认为该组的其他成员也会这么想。

    显而易见,很多不同的因素决定了参加实验的游戏玩家所选的数字。在我所

    教授的一些经济课上,我的学生参加这个游戏得到的分数一直很低,直到有一天我意识到:他们还是不够积极。但是,由于我无法在每次做这个游戏时奖给他们

    一辆小型奔驰车,所以我对他们说,我会给获胜学生的成绩单上额外加5分。于

    是,他们的游戏分数立马提高。

    试着和你的朋友玩这个游戏。小心不要太失望。

    [1] 达布隆币是一种古西班牙金币。——译者注

    [2] 这个故事基于一个名为“蜈蚣”的游戏,由罗伯特·罗森塔尔于1981年首次提出。第五章 婚姻介绍人

    在这个章节中,我们会学习纳什均衡,以及它在不同情境下是如何表现的

    ——从婚介策略到母狮子与水牛之间的斗争。我们也将学到,搭配两个数量相当

    的男人团体和女人团体,同时绝对排除不忠的算法,是如何获得诺贝尔经济学奖

    的。

    酒吧里的金发女郎

    2015年5月23日,伟大的数学家和诺贝尔奖得主约翰·纳什和他的妻子艾丽西

    亚,在挪威领完享有盛名的阿贝尔奖之后,在回家途中被一场车祸夺去了生命。

    在《美丽心灵》这部基于约翰·纳什生平而拍摄的电影的前半部分,我们能看

    到以下场景。纳什和他们的几个朋友坐在酒吧里,这时一个金发白肤女郎和几个

    浅黑肤色的女人走了进来。电影导演朗·霍华德不太相信观众的智商,于是明确说

    明这位金发女郎是最美的,而其他几位女人则稍显逊色(电影里就是这么表现

    的)。纳什和他的同伴决定对这位金发女郎展开追求,但纳什在思考了一会儿后

    阻止了所有人,并且一口气说出了他的战略观点。“我们的策略是有问题的,”他

    说,“如果我们都去追求这位美女,我们最终只会妨碍彼此。因为人们一般很难接

    受一个女孩和五个男人一起离开酒吧,那个女孩当然也不会在第一次约会时就这

    样做,我们中的任何人都不会得到她。所以当我们之后再去找她的同伴时,她们

    也不会搭理我们,因为没人想当第二选择。但如果我们都不找那位金发女郎呢?

    我们不会妨碍彼此,而且也不会侮辱其他的女孩。这是唯一获胜的方法。也是我

    们都能满足的唯一办法。”

    在他说服朋友接近美女是一个不好的策略之后,那位金发美女独自一人待在

    那儿。纳什轻而易举地赢得了她,其实自始至终这都是他的计划。当他的同伴愤

    怒而苦涩地坐在酒吧的一角,不明白自己是如何钻进这个圈套时,纳什走向那位

    美女,和她聊天,甚至由于某些原因而感谢她(或许是因为突然涌现出来的数学点子),但之后他很快把她留在了原地。制片人的想法似乎是想将纳什塑造成一

    个大大咧咧的科学家,对公式的兴趣要大于对女人的兴趣。甚至有些人会说,数

    学家就是发现其他东西比性爱更有趣的人。

    这一幕在这部电影中出现是有原因的。这个故事在博弈论中有类似的情境。

    请继续读下去吧。

    择偶策略

    想象在房间内有30位男士和30位女士,他们需要成双成对出现。从清晰的角

    度考虑,配对机制严格按照异性组合的原则。每位男士都会拿着一张标有数字的

    便条,数字1~30。这些男士从这些女士中挑出自己最喜欢的一位(当然,你也可

    以想象出一个由女士挑选男士的博弈。不管怎样,请记住,这只是一个博弈)。

    然后,每位男士向他选择的女士递一张标有他数字的便条。收到便条的女士必须

    从向她递便条的男士中选出她最喜欢的一位。收到多张便条的女士必须从中选出

    一位,而只收到一张便条的女士必须与递给她便条的男士配对。

    在理想的世界中,结果应该相当明显:男士每人挑选不同的女士,每位女士

    都收到唯一的便条,博弈结束。然而现实远非如此理想。通常情况下,当我介绍

    这个博弈时,人们会对我说:“我知道会发生什么。总会有那么一位女士收到所有

    男人的便条。”但是,让我们不要一下子就得出如此极端的结论。亚里士多德说

    过,真相总在两个极端之间的中间部分,但很少就在正中间。

    一次,我给一家高科技公司的员工介绍这个博弈。一位参与者(有数学博士

    学位)举手说她非常清楚这个博弈,并且已经思考了好几年。她向我介绍了她的

    洞见,她说,在一般情况下,收到便条的女士数量大致会是参与博弈的女士数量

    的平方根。我并没有继续询问这个平方根公式,因为我不想我的讲座因此失控,但让我们对她表示尊重并假设确实有5位女士收到便条。是的,我知道30的平方

    根比5大,但我们必须记住那些女士的数量只能是整数。在这种情况下,每位女

    士收到便条的平均数量将是6,但这并不是在告诉我们如何分配。现在收到便条

    的女士必须选出她们最喜欢的男士与她配对,并带他到大楼的顶层,参与为所有

    新组建的情侣而举办的晚会。当他们离开房间,这个博弈将以同样的方式在剩下的25位男士和25位女士中

    间继续进行。

    注意:如果你有心脏病,我建议你略过下一段。

    如果不是因为人类抑制机制自动启动,那些留在房间的人大概在博弈的早期

    阶段就已经十分难受了。此时,房间中所有的男士知道自己已经无法赢得自己真

    正渴望的女士,因为她不喜欢他们,而且很有可能已经在楼顶上同自己选择的男

    士相拥而舞。那么现在我有机会教一堂简单的心理学课,它是一个非常简洁而又

    深刻的内容,基本观点是:“每当一个朋友成功时,我就会死去一点。”课程结

    束。留在房间的女士也有理由感到低落,因为她们知道并没有男士真正想选择她

    们。毕竟,首选的女士现在正在楼顶上开派对呢。这很令人伤心。幸运的是,我

    们有着极好的抑制反应,因此博弈可以继续,就像没发生什么不好的事情一样。

    现在剩下的25位男士向剩下的25位女士中他们看上的那位递便条。假设有11

    位女士收到便条,每一位现在选出她们最喜欢的男士。博弈者的数量再次减少,直到房间里一个人也不剩。

    这样,这个故事最后组成了30对完美的配对。目前看起来非常清楚简单。真

    是这样的吗?

    不完全是。为了展示游戏的复杂,我亲自参与进来。当我走进房间,看到一

    位非常美丽的女士坐在其他参与者中间时,我大喜过望。我们暂且称她为A(例

    如,是演员安吉丽娜·朱莉或模特阿德里亚娜·利马或安娜·卡列尼娜的名字的首字

    母)。我当然喜欢她,因此从直觉上看,把我的便条递给她会是个好主意。但我

    真的应该这么做吗?一想起纳什的同伴在那家酒吧里的悲惨遭遇,我意识到我应

    当再想想。如果我那么喜欢她,那么其他男士也喜欢她是合乎情理的,这意味着

    她将收到几乎全部30位男士的便条,而不仅仅是我的便条。因此,她会反过来选

    我的概率实际非常渺小。我可能会遭到拒绝,并进入第二轮,那时我会去找我的

    第二选项,在此我应给她起一个浪漫的名字:B。同样,我很有可能无法赢得B的

    芳心,因为被A拒绝的大多数男士现在会盯住可爱的B女士。这样我会继续往下跌

    落,直到最终落入Z的怀中。

    好吧。我们都知道这个意思。那么我应该如何参与这场博弈?最合理的策略是什么?它基于什么原理?如果选择我的第一选项太冒险,也许我应在第一轮中

    做出一点妥协,选择D——也就是我的第四选项。

    犹太人有句谚语:“如果你开始不做出一点妥协,你将在最后做出一个巨大的

    妥协。”

    那么,就这么决定了:我选择D。但如果每个人都熟悉这条我刚才给你们的

    建议,而都给自己列表上稍微靠后的女士送便条的话怎么办?在这种情况下,很

    有可能A不会得到任何便条。如果我不利用这个机会就太可惜了。你记得电影中

    的纳什是如何说服他的朋友放弃,从而使他可以赢得美女的吗?

    重要建议:在做决定之前,问问你自己如果每个人都和你的想法一样,会发

    生什么。同时记住,并非所有人都和你有一样的想法。

    事实是,这会发展成一个更有意思的情境。假设房间中所有男人,除了约翰

    尼,都上过有关博弈论、决策,甚至是多变量优化的课程。在想该怎么办时,他

    们都忙着进行复杂的计算。他们告诉自己:“我们不应该给A递便条,因为上述原

    因,她不会选择我们,我们会被降级到第二轮,届时情况也不会更乐观。以此类

    推。”当所有男士都这样想时,约翰尼并没有使用他的思考工具。权衡选择并不是

    他的选项。约翰尼环顾四周,看到A,决定给他喜欢看到的这位女士递便条。事

    实上约翰尼赢得了她,仅仅因为他是唯一向A递便条的人(这个故事也可以说明

    一些你可能知道的奇怪夫妻组合的情况)。

    是的,约翰尼赢得了A恰恰是因为他缺少复杂性。当我为高管们举办研讨会

    时,我喜欢给他们展示一个同样的经济模型,其中最不聪明的参与者(我会把自

    己放入这个角色中)在和相对聪明的参与者(高管)竞争时会获得最高的收益。

    纳什均衡(和最勇敢的母狮子)

    现在似乎是定义博弈论(以前被称为“游戏理论”)基础概念——纳什均衡

    ——的合适时间。让我对它进行更加不那么精确的定义(有时候稍微的不精确可

    以帮助避免冗长的解释):纳什均衡是假设所有参与者只能控制自己的决定,没

    人能从改变当前策略中受益的情境。我们也可以这样说:纳什均衡是假设所有参与者仅能控制自己的决定,他们

    不会改变自己决定的一组策略,哪怕已经提前知道其他参与者的策略。

    例如,在择偶游戏中的妥协策略不是一种纳什均衡,因为如果所有参与者都

    做出妥协,你不应当妥协:事实上,你应当将你的便条递给A。

    我相信你们已经意识到,如果所有参与者都将便条递给A,这也不是纳什均

    衡。

    那关于与朋友一起分担账单的晚餐呢?点便宜的菜会是纳什均衡吗?那点昂

    贵的菜呢?如果每个人都点菜单上最贵的菜呢?这是纳什均衡吗?好好想一想,直到你确定自己的答案。

    最后,还有一个例子可以对纳什均衡概念予以说明。它来自动物行为领域。

    谈动物似乎更加容易,因为在某种程度上,动物看起来很理性,也就是说,除了

    人类以外的所有动物通常都会理性地行动。这也说明为什么分析人类行为会比分

    析其他物种的行为更加困难。

    这个例子取自我曾经偶然在电视的科学频道上看到的一个场景:一只母狮子

    袭击一个由上百头水牛组成的牛群,那只被袭击的水牛和其他的水牛都仓皇而

    逃。和任何聪明的人一样,我问我自己,它们为什么要逃?显然,一百头水牛比

    一只母狮子要更加强壮。它们需要做的就是转过身来,朝着母狮子的方向冲过

    去,这样不需要多长时间水牛群就会战胜那只母狮子。

    它们为什么不这么做呢?我思考着,但马上我想起了纳什。逃离母狮子是纳

    什均衡的绝佳案例。请听我解释。假设所有的水牛都逃离母狮子,而只有一头水

    牛——我称它为乔治——在想:“科学频道正在拍摄我呢,这个频道收视率很高

    (乔治是一头大草原上的水牛,因此对收视率还不太理解),所以我不能逃跑。

    万一我的孙子看到了怎么办?”(乔治如果像我,它可能会担心它的母亲会看

    到。)于是我们可爱的乔治决定转过身,猛烈攻击那只觅食的狮子。它做了明智

    而正确的决定吗?绝对不是。这个决定不仅错误,同时也是乔治做的最后一个决

    定。母狮子一开始看到乔治冲过来确实很惊讶,但它很快从吃惊中恢复过来,于

    是几分钟过后乔治就死了。当整个水牛群逃离母狮子时,最佳的策略就是跟着

    跑。这个策略不能变。因此,在这种情况下,逃跑就是纳什均衡。现在,让我们假设水牛群决定对母狮子进行反击。这也不是纳什均衡,因为

    如果提前知道水牛群要对母狮子进行反击,那么那只没有加入反击队伍的水牛显

    然将会受益。毕竟,即使整支水牛群开始进攻,其中一些水牛也会冒着受伤甚至

    死亡的风险。因此,我们可能会看到另一只名叫雷金纳德的水牛朝着它那些突击

    中的同伴叫道:“我的鞋带刚才开了。我没法加入你们的进攻队伍了。你们赶紧

    去,别管我!”雷金纳德受益了,因为它不冒任何风险。

    逃离母狮子是纳什均衡。当所有水牛都在逃离,每一个水牛都会从一起逃跑

    中受益,前提是它只能决定自己的行为。这确实也是我们常常在自然中看到的情

    境。同时,袭击母狮子不是纳什均衡,因为当每头水牛都进攻时,这是你系鞋带

    的绝佳时机。这也是我们在自然界中很少看到这种反击策略的原因。

    当一个独狼恐怖分子或者一小撮恐怖分子试图劫持一架载有很多乘客的飞机

    时,类似的事情是否也会发生呢?

    第二次世界大战纪录片反复播出这样一个场景:一排排的德国战俘在雪地里

    前行,只有两个懒散的红军士兵看管他们。我常常在想,为什么这些德国俘虏不

    袭击看管他们的士兵?有可能是因为红军士兵对这些德国囚犯解释过,袭击他们

    会偏离纳什均衡,尽管那会儿纳什自己还没有想出这个理论。(请记住,当他们

    被禁止说话时,这些战俘只能控制自己的决定。)

    纳什均衡的好处在于,很多博弈,无论它们的起点是什么,最终都会以纳什

    均衡点结束。在某种程度上,这与纳什均衡的定义——一种由参与者持续维持的

    稳定情境——密切相关。当然,这只有在没有外界干预和其他参与者不受影响的

    情况下才能实现。

    那么,我们又怎么解释鬣狗与水牛不同的行为呢?鬣狗群通常袭击单独的狮

    子或者其他比它们更大、更强壮的动物。毕竟,袭击一头狮子可能不会使鬣狗受

    益。或者说,这种行为也许对整个鬣狗群体有益,但涉及每匹鬣狗个体的决定,它停下来“系鞋带”才对它更好。因此,它们为什么,以及如何组织起来袭击狮子

    呢?这一困境往往让我很苦恼,因为鬣狗就像从没听说过纳什一样……这简直就

    是纯粹的无知。

    科学频道再次拯救了我。一个纪录片显示一群鬣狗在外出狩猎前围成一个圆圈,在嚎叫和发出其他声音时一致地摆动着身体,就像篮球队经常做的那样。它

    们让自己进入一种疯狂的状态,并在非常愤怒、口吐泡沫时发起进攻——也就是

    说,它们在不能选背叛策略时才会一起进攻。因为当你对某种东西入迷而疯狂

    时,你是不会背叛你的同伴的……这就是事实。这也许解释了远古部落的狩猎舞

    和战舞的源起。否则,每一个个体都会自然地想:“一头猛犸象?算了吧,伙计。

    事情会变得一团糟。不要用箭射它,收起你的长矛。它不值得这么做。”但如果他

    们都这么想,那他们将永远无法捕到一头美味的猛犸象,而且很有可能会被饿

    死。人类需要合作,和鬣狗一样,围成一个圆圈,手里拿着长矛,变得疯狂,然

    后出去狩猎。

    同样,我们应当记住,不仅仅对人,对动物也一样,事情永远不会像看起来

    那么简单。2008年,YouTube网站上最受欢迎的视频之一是《克鲁格的战役》。

    这是一个业余的视频,拍的是一群非洲母狮将一头小水牛从水牛群中孤立出来,并将其逼入河中,这样它们就能吃小水牛的肉了。然而,正当那些母狮子向小水

    牛逼近时,一条鳄鱼从河里冲出来,试图抓走那头可怜的小水牛。母狮子群奋起

    反击,重新夺回了小水牛。但就在小水牛变成母狮子群的午餐点心时,水牛群回

    来,它们猛烈攻击母狮子群,把它们赶走,并救回了小水牛——使故事(对水牛

    而言)有了一个圆满的结局。

    如何解释这个故事?我不知道。因为水牛很少接受媒体采访。

    不管怎样,我们应永远记住这条精彩的建议(特别是你继续阅读本书时):

    大多数事情比它们看上去要复杂,即使你认为你能理解这句话。

    让我们回到择偶问题上。所有择偶游戏参与者都会问自己一个问题:我的目

    标是什么,我期待自己从这个博弈中得到什么?事实上,这是参与任何博弈时都

    应当提出的问题。

    在确定策略前知道你的目标很关键。我常常看到一些人没有定义自己的目标

    就开始参加博弈。记得柴郡猫曾对爱丽斯说,如果你不介意去哪儿,“那么你选择

    哪条路也就不重要了”[1]。当你选择你的策略,或者选择你的道路时,你的目标

    才非常有关。举例说,如果择偶游戏中的一位参与者遵循恺撒·波吉亚(Cesare

    Borgia)原则,即“要么恺撒,要么什么都不要”——也就是说,不管怎样他都要A

    ——那么,他的策略就很明显了。他可以把便条递给安吉丽娜并虔诚祈祷。没有其他的方法。如果他不把便条递给她,那他肯定得不到她。他肯定不会达到自己

    的目标。

    运用上述效用函数[2]

    的参与者会享受风险。从另一方面说,如果一个参与者

    的目标仅仅是为了不至于落到与Z共舞的下场——除了Z谁都可以(规避风险的参

    与者)——他的可选策略也很清楚。假设在意愿图表上,Y的排名比Z高一格,那

    么规避风险者会一开始就把便条递给Y——在第一轮就这么做。当然,事情总是

    比第一眼看上去要更加简单。如果许多其他参与者都决定他们的效用函数是“除Z

    以外的任何人”,那该怎么办?在此情况下,Y会得到超出自己预料之外的一堆便

    条(她会疑惑,是什么让她突然一下变得如此受欢迎)。

    不仅这个博弈该如何进行不甚清楚,我们也不容易描述出其基本的假设。男

    人对女人的品味如何分布?在两种极端的情况下,所有男人要么视所有的女人一

    个样,要么会出现排序混乱的情况,但这两种假设显然是不现实的。实际的分布

    应当介于两种情况之间。而男人的自尊因素又怎么计算呢?同样,男人愿意冒风

    险的程度应如何分布?简言之,在我们开始用数学方式解决这个博弈之前,我们

    需要进行很多准备工作,也需要考虑很多不确定因素。

    《圣经》上说,上帝用七天创造出整个世界。根据犹太人的传统,自此之后

    上帝就开始忙着给男女配对。你应该可以猜出确保每个人都找到合适的伴侣是多

    么困难。

    稳定婚姻问题

    (关于相爱的伴侣、欺骗和诺贝尔奖)

    婚姻介绍人的问题(续集)

    佐薇是一个婚姻介绍人,她有一份列着200个客户的名单,其中包括100位男

    士和100位女士。每一位女士都给佐薇提供了一份名单,上面按着自己的喜好将

    这100位男士进行了排序。位居名单之首的是“白马王子”,之后则是她们的第二选择,以此类推直到第100位。佐薇名单上的100位男士也对女士名单进行了同样的

    排序,按喜好把她们排列出来。

    现在,佐薇需要为每位客户找一位异性进行配对,并确保他们都能结婚、建

    立家庭并幸福地生活在一起。显然,她客户中有些人不会和他们的第一选择在一

    起。如果名单上的一位男士首先被两位或者更多的女士所选,那么总会有人退而

    求其次。但是即使没有男士会被一位以上的女士选为最佳伴侣,并且没有哪位女

    士会被一位以上的男士选中,也无法保证都能皆大欢喜。

    我们现在考虑以下案例(为简洁和示范效果,我将故事简化成只涉及三位男

    士和三位女士)。

    男士的选择如下。

    ●罗恩:尼娜、吉娜、洋子

    ●约翰:吉娜、洋子、尼娜

    ●保罗:洋子、尼娜、吉娜

    女士的选择如下。

    ●尼娜:约翰、保罗、罗恩

    ●吉娜:保罗、罗恩、约翰

    ●洋子:罗恩、约翰、保罗

    在上面这个例子中,每位男士的首选都是不同的女士,而每位女士也都选择

    不同的男士。虽然每个人的选择都不同,但没有理由不担心。我相信你知道为什

    么。

    只有当每位女士首选的男士也认为,这位女士就是他的梦中情人的时候,这

    对配偶才会幸福并享受皆大欢喜。例如,如果保罗爱吉娜,而吉娜也爱保罗;如

    果尼娜迷恋罗恩,而罗恩也仰慕尼娜;约翰是洋子的白马王子,而约翰也愿意为

    了洋子赴汤蹈火。在这种情况下,我们可能获得以下的选择。男士的选择如下。

    ●罗恩:尼娜、吉娜、洋子

    ●约翰:洋子、尼娜、吉娜

    ●保罗:吉娜、洋子、尼娜

    女士的选择如下。

    ●尼娜:罗恩、约翰、保罗

    ●吉娜:保罗、罗恩、约翰

    ●洋子:约翰、罗恩、保罗

    如果三位男士都选择了同样的女士会如何?

    男士的选择如下。

    ●罗恩:尼娜、吉娜、洋子

    ●约翰:尼娜、吉娜、洋子

    ●保罗:尼娜、洋子、吉娜

    你认为佐薇会怎么做?

    如果三位女士交的名单完全一样又怎么办?

    女士的选择如下。

    ●尼娜:罗恩、约翰、保罗

    ●吉娜:罗恩、约翰、保罗

    ●洋子:罗恩、约翰、保罗

    佐薇可能会遇到很多麻烦……现在让我们假设我们有10位女士和10位男士。让更多的人得到自己的第一或

    者至少第二选项;或者让尽可能少的人和自己的最后选项配,以上两种情况哪种

    更好?

    这个问题没有明确的答案。

    然而,佐薇是一个现实的女人。她知道绝不可能保证皆大欢喜,所以她给自

    己定下尽可能保守的目标。她的挑战是使配对的双方尽可能稳定,不会出现一方

    不忠的现象。

    在现实意义上这意味着什么呢?为防止出现不忠的现象,佐薇必须确保组成

    的一对不存在其中一方受外部因素强烈吸引的现象。保罗和尼娜、罗恩和吉娜就

    是一组很好的例子。我们假设保罗喜欢吉娜甚于自己的妻子尼娜,而吉娜喜欢保

    罗超过她的丈夫罗恩。那种组合使背叛变得不可避免。请注意,如果保罗喜欢吉

    娜甚于自己的妻子尼娜,只要吉娜爱自己的丈夫而非保罗,她就会断然拒绝保罗

    的求爱。

    如果保罗想要吉娜甚于想要自己的妻子尼娜,而吉娜对保罗也有同样的感

    觉,同时不喜欢自己的丈夫罗恩,那么如果罗恩选择尼娜而不是吉娜,而尼娜喜

    欢罗恩而不是保罗,这个问题就能轻松解决。我们需要做的就是拆开原来的配对

    (保罗和尼娜、罗恩和吉娜),并组建两对全新且更快乐的伴侣:罗恩和尼娜、保罗和吉娜。

    稳定婚姻(盖尔-沙普利)算法

    在1962年,著名的美国数学家和2012年诺贝尔经济学奖得主、经济学家罗伊

    德·沙普利与已故美国数学家、经济学家大卫·盖尔(我们在巧毒游戏那章中提过

    他)曾经演示过,如何使同样数量的男人和女人相互配对,并且不出现背叛的情

    况。很重要的一点是,我们必须理解他们的运算法则并不保证幸福,只保证稳

    定。因此,也有可能尼娜嫁给保罗的同时还想着约翰,但算法确保约翰爱他的妻

    子胜于尼娜。这并不意味着约翰的婚姻很幸福,他也有可能想着其他的女人,但

    即使这样,这个算法也能确保那个他想着的女人会选择自己的丈夫而不是他。以此类推……

    盖尔-沙普利算法很简单,且包含有限数量的迭代(四舍五入)。让我们看一

    下它在四位男士——布拉德·皮特、乔治·克鲁尼、罗素·克劳以及丹尼·德·维托,四位女士——斯嘉丽·约翰逊、蕾哈娜、凯拉·奈特莉、阿德里亚娜·利马的例子中

    如何运作。这个算法在任何相同数量的男士和女士案例中同样有效。

    表5-1为男士的选择。

    表5-1 男士的选择

    表5-2为女士的选择。

    表5-2 女士的选择

    我不会给你解释这个运算法则,但我会告诉你这个在现实中是怎么运作的。

    在第一轮中,每一位男士向排在自己名单上首位的女士求爱。这样,布拉

    德、罗素接近斯嘉丽,丹尼去找蕾哈娜,而乔治给阿德里亚娜打电话。每一位女士选择列在自己名单最高位置的男士——如果有一个以上追求者的

    话。如果只有一位男士主动追求,那么他就是她的对象;如果没人找她,她就在

    这一轮中保持单身。因此斯嘉丽选择布拉德,因为她给布拉德的打分高过罗素。

    让我们现在看看组成了几对伴侣。请记住,这只是暂时的,他们只是订婚,而不是结婚。

    布拉德-斯嘉丽,乔治-阿德里亚娜,丹尼-蕾哈娜

    在第二轮中,那些还没有配对的男士向在自己名单上排名最前且没有拒绝他

    们的女士求爱。唯一还没有配对的男士是罗素(他碰巧在朗·霍华德的电影中扮演

    诺贝尔奖经济学得主约翰·纳什),于是他向阿德里亚娜求爱。由于阿德里亚娜更

    想要罗素而非乔治,因此她取消了与乔治的订婚,同时宣布与罗素订婚。现在,我们有以下几组配对:

    布拉德-斯嘉丽,罗素-阿德里亚娜,丹尼-蕾哈娜

    现在唯一单身的男士是乔治,他向蕾哈娜求爱,后者愉快地接受了他,因为

    在她的名单上,乔治排名比丹尼靠前。于是:

    布拉德-斯嘉丽,罗素-阿德里亚娜,乔治-蕾哈娜

    丹尼现在单身了。他去找斯嘉丽,但她选择布拉德。再来一轮,什么也没

    变。之后,丹尼想对蕾哈娜再赌一把,但她和乔治在一起很满足。丹尼很沮丧且

    面临危机,他试了试凯拉,后者张开双臂拥抱了他。凯拉已经单身太久,因此即

    使丹尼也能让她满意。

    这个算法在此终结,即所有的男士都被拴住(且显然所有的女士也订了婚,因为这两组人都在数量上对等)。因此最终入围的是:

    布拉德-斯嘉丽,罗素-阿德里亚娜,乔治-蕾哈娜,丹尼-凯拉

    他们从此幸福地(或至少积极稳定地)生活在一起。

    我们很容易接受,通过盖尔-沙普利算法而形成的配对将保持稳定,但为清除

    所有的疑问,让我们证明这一点。如果你们不是特别喜欢逻辑分析和证明,而且如果你相信盖尔-沙普利算法无论如何都有效,那么你可以直接跳入下一章。

    很高兴你还在这里。现在开始证明。

    这个证明由三步构成:第一,我们会看到算法告终;第二,我们会证实每人

    都能配对成功;第三,我们会证实每一组配对都是稳定的。

    1.显然,这个运算不会无限进行下去。在最糟糕的情况下,所有男士都向每

    一位女士求爱。

    2.显然,订婚男士的数量将总是与订婚女士的数量相等。一旦一位女士订

    婚,她会一直保持这种状态(即使订婚对象不是同一位男士)。此外,任何一组

    的任何人在最后都不可能保持单身。简言之,如果罗恩把尼娜放在自己的名单中

    (即使她是他的最后选择),那么即使没有其他男士选尼娜,罗恩最后也会选

    她。这样,这个运算确保没有人不被配对。

    3.这个运算法则也确保这些伴侣的稳定吗?是的——而且我们将证明这一

    点。假设洋子是约翰的妻子,而尼娜是保罗的妻子。那么,有没有可能洋子会选

    择保罗,而保罗会喜欢洋子超过自己的现任配偶呢?这样会把我们带到一种接近

    背叛的境地。

    下面,我们会假设这种情况是可能的,然后遭遇一个障碍——一种逻辑矛盾

    以证明上述情况实际是不可能的。

    我们假设存在一种不稳定性——我们有两对伴侣:保罗和尼娜、约翰和洋

    子。而保罗喜欢洋子,洋子也喜欢保罗,他们对彼此的倾心程度都超过对自己的

    现任伴侣。根据这个算法,保罗应在去找尼娜之前,先去找洋子(因为根据我们

    的假设,洋子在他最初名单上的排名比尼娜要高)。现在,可能出现两种情况:

    第一种,洋子接受保罗;第二种,洋子拒绝保罗。

    如果出现第一种情况,为什么洋子不愿意和保罗生活在一起呢?可能她选择

    了排名更靠前的人——约翰或者其他人。不管怎样,她现在和约翰在一起,这意

    味着约翰的排名比保罗高。这就是刚才预示的逻辑矛盾。如果出现第二种情况,洋子拒绝保罗,因为她想要一个更好的男人——约翰或者其他人,但她现在和约

    翰在一起的事实就证明了约翰的排名比保罗靠前。同样,最早的假设是存在矛盾的。

    简言之,运算法则告终,每个人都有一个配偶,而这些配对都是稳定的。

    如果女士都根据自己的喜好选择男人,会发生什么情况?那就是刚才男演员

    的例子就会产出完全一样的配对。因为我们在此只有一对稳定的配对。

    然而,不会永远都是这样。如果有超过一对稳定配对,当女士做出选择时,就会形成不同的配对。

    “在爱情中说到坏选择是不对的,因为只要有选择存在,就只会是错误

    的。”

    ——马塞尔·普鲁斯特

    性别的战争(第二轮)

    现在该回到这章开始时提到的案例,并提醒我们各种性别的选择。

    男士的选择如下。

    ●罗恩:尼娜、吉娜、洋子

    ●约翰:吉娜、洋子、尼娜

    ●保罗:洋子、尼娜、吉娜

    女士的选择如下。

    ●尼娜:约翰、保罗、罗恩

    ●吉娜:保罗、罗恩、约翰

    ●洋子:罗恩、约翰、保罗

    仔细考虑一下,我们就能清楚地发现这个案例只需要进行一轮。男士会向他们的第一选择递纸条,从而形成如下配对:罗恩-尼娜、约翰-吉娜、保罗-洋子。

    仅此而已。显然,他们都很稳定,因为所有的男士都找到了梦想中的女神。对于

    男士而言,这是最优方案。然而,所有女士得到的都是她们的最后选择。她们不

    可能满意。

    如果由女士向男士递纸条,仅一轮就能产生以下配对:洋子-罗恩、吉娜-保

    罗、尼娜-约翰。同样,这里的每一位女士都赢得了她们最喜欢的男士,而男士不

    得不和自己的最后选择共度余生。

    因此,我们可以理解,这个游戏使在第一轮中递纸条的一方占有优势。

    另外,我们这里有另一组稳定的配对:尼娜-保罗、吉娜-罗恩、洋子-约翰。

    你们可以检验一下他们的稳定性——检测一下背叛的情况不会在此发生。

    没有模式的足球运动员

    盖尔-沙普利算法并不复杂,但也不是不重要。如果我们放弃两性假设,转而

    假设四位足球运动员在一场重要比赛前需要两人一屋过一晚上,关于如何找到一

    位共处的室友,我们可能找不到一种稳定的解决办法。

    表5-3是四位足球运动员及其选择。

    表5-3 四位足球运动员及其选择

    看看这张表,你就会发现,这里并没有稳定的配对。

    诺贝尔奖得主是……盖尔-沙普利算法有很多应用方法。其中最著名的用法之一是将医学院的毕业

    生分配到医院里实习。我想,你已经猜出医院赢得了第一提议者的角色(在此还

    存在一些法律诉讼问题悬而未决)。另一个“稳定婚姻问题”的重要应用是,在因

    特网服务中将使用者分配到不同的网络服务器。

    2012年,埃尔文·罗斯和罗伊德·沙普利因稳定分配理论和基于盖尔-沙普利算

    法的市场设计实践而获得诺贝尔经济学奖。

    盖尔于2008年去世,因此未能收获奖项,而罗斯在为盖尔-沙普利算法找到其

    他重要的应用后,也领取了一个奖项。罗斯也是新英格兰肾脏交换项目的发起

    人。

    插曲 角斗士博弈

    角斗士博弈是我最喜欢的博弈之一。我在教授概率或博弈论时总会使用它。

    现在,我把这个博弈主要推荐给真正的数学爱好者。

    这个博弈是这样的。有两组角斗士——分别是A(雅典人)组和B(野蛮人)

    组。让我们假设A组由20位角斗士组成,而B组由30位角斗士组成。每一个角斗士

    都有一个标识号,它是一个正整数,表明角斗士的力量大小(比方说是他可以举

    起的公斤数)。这些角斗士以决斗的方式互相打斗。他们的获胜概率如下:当一

    个力量是100的角斗士对抗一个力量是150的角斗士时,他的胜算是

    将“100÷(100+150)”,因为角斗士力量越强,他获胜的概率越大。如果决斗的

    两个角斗士力量相当,当然他们的获胜概率是50%,而且他们之间的差距越大,越强壮的角斗士的胜算就越大。

    每一组都由一位教练来决定角斗士出场的顺序,但只会决定一次。他可能会

    最早或最晚派出自己最强壮的选手,但不管怎样,决斗获胜者会回到队尾,等待

    下次出场——你无法让你最强壮的选手一直出场。现在,当一场比赛结束时,失

    败者会退出比赛,而获胜者则吸收失败者的力量——也就是说,当角斗士145击

    败角斗士130后,后者会退出比赛而前者会被重新命名为角斗士275。当参赛一组

    用完所有的角斗士时,博弈结束,该组也自然宣布失败。那么,这里最好的策略是什么?参加决斗的角斗士的出场顺序应该是什么?

    (在读下去之前,请你们花点时间想一想答案。)

    答案相当让人惊讶:你们完全不需要教练。角斗士出场的顺序无论怎样也不

    会改变胜算率。胜算率等于一组角斗士力量之和除以两组角斗士的力量之总和。

    请证明。(提示:刚开始不要用一般的情况——那会很难。开始时用一个雅

    典角斗士和两个野蛮角斗士;然后检查一下,在用两个雅典角斗士和两个野蛮角

    斗士的情况下会发生什么……我希望你能找出一个模式。你可以通过归纳法解决

    这个问题。)

    我无法说这种练习会给团队运动的教练提供任何重要的启发。显然,教练很

    重要,但有些时候这个重要性被过高估计了。

    [1] 引自英国作家刘易斯·卡罗尔的童话《爱丽斯漫游仙境》。——译者注

    [2] 效用函数是对偏好的一种测量。它为所有可能的结果赋值,称为“效用”。偏好的结果会获得更高的值,不同的人被认为有不同的效用函数。第六章 教父和囚徒困境

    用这一章来介绍所有博弈论中最受欢迎的一个博弈——囚徒困境。我们会审

    视这个博弈的每个方面,包括“重复”的囚徒困境版本,同时学习一些重要的事

    情:自私的行为不仅在道德上是有问题的,在很多情境下,也是战略不明智的。

    博弈论的最著名和最受欢迎的博弈是囚徒困境。它来源于20世纪50年代梅里

    尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)为兰德公司做的

    一个实验。阿尔伯特·塔克(Albert Tucker)在1950年的讲座中提到了这个在斯坦

    福大学心理学系所做的实验,博弈的名字也由此而来。有无数的文章、书籍和博

    士论文是关于这一主题的,我相信哪怕在学院之外,也很少有人从未听说过。

    在这个博弈受欢迎的版本中,让我们假设有两个人,暂且称他们为A和B。他

    们被逮捕后,处于监禁中。警察怀疑他们犯了可怕的罪行,但并没有确凿的证

    据。因此,警察需要与他们谈话,最好让他们说一说彼此。现在,A和B被告知,如果他们都决定沉默,两人都会因一些较轻的指控,如盗窃或其他一些不法行

    为,而服刑一年。检察官想和他们做个交易:如果他们其中一人背叛另一人,这

    个人会马上获得自由,而另一个人则会因为被证实的罪行而服刑20年。如果每个

    人都指控对方,则他们都要服刑18年(其中因协助指控而减刑10%)。

    表6-1总结出了博弈的规则(数字表示监禁的年限)。

    表6-1 博弈规则

    数学家称这种图表为博弈矩阵——他们不喜欢使用诸如“表格”或“图表”等术

    语,因为担心普通人可能会理解这些内容。坦白地说,目前为止听起来这是一个非常无聊的故事,也很难让人理解为什

    么这么多人会写这个故事。当我们开始研究博弈怎么进行下去时,事情才开始变

    得有趣。一眼看去,结论很清楚:他们应保持沉默,用一年的时间花纳税人的

    钱,如果他们成为模范犯人,甚至可以在一年内重获自由。然后故事结束。如果

    事情就这么简单,没有人会关心囚徒困境。事实是,这里任何事情都有可能发

    生。

    为理解困境,让我们先站在A的角度想一想:

    我不知道B可能说什么或已经说了什么,但我知道他只有两个选择:沉默或

    背叛。如果B保持沉默,而我避而不答,那我会在监狱待一年;但如果我背叛了

    他,我可以一走了之。我是说,如果B决定闭口不谈,我可以走掉。我当时真应

    该把他扔到车子底下。

    另外,如果B放弃沉默而我保持沉默,我会烂在监狱里。20年时间真是太漫

    长了,所以如果他招了,我也应该招。那样只会关我18年。比20年强,不是吗?

    我知道了。背叛不管怎样都是我的最佳选择,因为我要么可以一天牢都不

    坐,或是少服刑两年。两年就是730天的自由时间。我不傻!

    正如我上面谈到的,这是一个对称的游戏,即两个参与方都是平等的。当

    然,这意味着B也会在一间牢房里花时间做同样的计算,并得出同样的结论,意

    识到背叛才是他的最佳选择。这告诉我们什么呢?两个参与者都理性地照顾着自

    己,而结果对双方都很糟糕。游戏规则让他们都坐了18年牢。我甚至可以想象到

    一年后,A和B在监狱操场里散步时,奇怪地看着对方,挠挠自己的脑袋,同时在

    想:“这一切是怎么发生的?太奇怪了。如果我们对‘囚徒困境’的概念及其玩法更

    了解,我们现在就可以是自由人了。”

    A和B错在哪里?他们真的错了吗?毕竟,如果我们按照这一逻辑,可以看到

    两人大概都没有做错:每个人都选择首先关照自己利益,同时意识到背叛才是他

    们最好的选择,无论另一个囚徒会怎么做。所以他们都背叛对方,而且都没有因

    此受益。事实上,他们都遭受了损失。你们现在应该已经意识到了结果——博弈参与方按照背叛策略同时付出代价

    (18,18)——同样也是纳什均衡。

    纳什均衡是一组策略组合,参与者事后都对自己选择的策略及造成的结果不

    后悔(参与者仅能控制自己的决定)。

    也就是说,如果另一位参与者选择背叛,我也应当这样做。这个(18,18)

    结果是纳什均衡,因为一旦两个参与者都选择了背叛策略,如果其中一人在最后

    一刻决定他还是保持沉默,那么他会被监禁20年而不是18年——他会失败并抱憾

    终身。同时,他不会后悔选择背叛策略——纳什策略。所以问题不在于赢或者

    输,而是在知道对方选择的情况下,不后悔自己的选择。

    另外,沉默并不是纳什策略,因为如果你知道另一个参与者也选择了沉默,你若背叛了他,自己的结果会更好。这样,你的刑期被取消,而且你比选择沉默

    时的收益要更大。这个案例显示,除此之外,纳什策略可能不是明智的,因为你

    原本很可能只需要囚禁1年,而结果被囚禁了18年。事实上,囚徒困境存在一种

    在个人、个体理性和集体、群体理性之间的冲突。每个人做出了他自己最好的选

    择,但作为一个群体……他们两败俱伤。

    当参与者做出自己的最佳选择,完全不考虑他的行为会对其他参与者带来的

    后果时,结果对所有人都是灾难性的。在很多情境下,自私的行为不仅在道德上

    有问题,在策略上也是不明智的。

    所以,我们如何解决这个难题呢?

    这里有一个选择:假设A和B都不是普通的囚犯,而是一个强悍犯罪集团的成

    员。从他们宣誓效忠之日起,教父就警告他们:“你们可能听说过囚徒困境,甚至

    读过相关的研究论文。所以我现在必须告诉你们,我们中间不会有背叛策略。如

    果你背叛了组织中的其他成员,你将会在很长的时间里保持沉默……这个时间有

    可能是永远。而且你不会是唯一被迫沉默的人,因为我们的人会让所有你关心的

    人都沉默,永久地沉默。你知道,我喜欢沉默的声音。”

    在得到这条信息之后,基本不存在什么困境了。两个囚徒都会避而不答,甚

    至会因此受益,因为他们只需要服刑一年。这意味着,总体上看如果我们把选项

    减少,实际上结果会更好,这与普遍的观点——更多选择往往会更好——相冲突。所以,当教父命令他的下属变得又聋又哑,结果对两个犯人都好……虽然这

    不利于警察和遵纪守法的公民。

    另一个可以解决囚徒困境的可执行协议的例子是使用汇票。汇票是商业界的

    一个工具。交易方A发出一张票据,要求其银行在B发出的货物与A和B签署的提

    货单完全一致时,才支付给交易方B一定的金额。这样,交易方A允许银行对他自

    己和交易方B进行监管。一旦A将钱存入银行,他就不能再欺骗(背叛)B了,因

    为只有银行才可以决定B的货物是否符合票据要求,而不是由A来决定。然而,如

    果交易方B选择欺骗(背叛),他拿不到一毛钱;而如果B遵循协议(保持沉

    默),发出的货物与AB之间达成的协议一致,B将会收到全款。

    在现实生活中,人们常常面临类似的困境,而且结果显示,在生活中和在模

    拟游戏中,人们确实倾向于相互背叛。

    就连歌剧作曲家贾科莫·普契尼的作品《托斯卡》也包含一个典型的双向背叛

    的囚徒困境。邪恶的警长斯卡比亚向托斯卡做出承诺,如果她愿意委身于他,他

    就不会杀害她的爱人:他只会使用空包弹。但他们都欺骗了对方。托斯卡用刀刺

    伤了斯卡比亚,而斯卡比亚则用真子弹射死了托斯卡的爱人。托斯卡最后自杀身

    亡。这是一个多么经典的歌剧结尾!还有伟大的音乐!

    在囚徒困境中,也许同样在《托斯卡》中,即使参与者同意不背叛对方(因

    为他们对这一困境很熟悉),他们也很有可能难以遵守协定。假设在两个囚犯被

    各自关进监狱前,他们知道俩人会面临囚徒困境,并且决定即使有提议,也绝不

    会出庭做证:他们会保持沉默并服刑1年。然而,一旦他们分开,独自一人时,都会禁不住暗自怀疑,对方是否会遵守诺言。在这种情况下,结果将会相同:他

    们还是意识到背叛是更好的选项。如果A背叛B,A会一走了之;但如果两位相互

    背叛,他们仅服刑18年,而不是20年。因此,即使他们之前已经达成协议,他们

    还是会背叛。

    这也许看起来毫无理性可言,造成了灾难性的后果。一个理性的囚犯或许会

    得出结论,如果另一个囚徒和他想的一样,而且他也认为18年的刑期比1年要糟

    糕得多,他会决定保持沉默。部分博弈论专家确实认为理性的参与者都会保持沉

    默。我个人并不能理解其中的原因。毕竟如果我身处这类情境,我不会对另一位

    参与者的想法做出这样不安全的假设,而且我会意识到背叛是我更好的选项。虽然我不愿承认,但我还是会背叛对方,因为他也会背叛我,我们都会被囚禁很多

    年,同时试图弄清楚到底哪儿出了错。

    囚徒困境是否意味着人类永远无法合作,或者说至少在面临囚禁或类似威胁

    时?这种囚徒困境意味着什么?看起来这样的结论无法避免。在这类博弈中,以

    及在类似的情况下,人们总会互相背叛。另外,我们知道人们会相互合作,而且

    不仅仅是在和黑手党头目交心谈话之后。我们如何调和这一明显的矛盾呢?

    当我刚开始思考这个问题时,我无法找出答案,直到我回忆在军队服役的经

    历,以及我在开始学开车时发生的事情。在我服役的那些年里,我总能请求人们

    帮我更大的忙,而且他们也常常给予积极答复。我可以请我的连队中的战友在一

    些任务中代替我的位置,甚至当轮到别人休假的时候自己回去休探亲假。之后我

    结束了自己的任期,并且拿到了驾照,实际上是相当迟了。我记得第一次开车出

    去,碰到一个停车标志,我停下来,等着有人让路并让我重新进入车流,但

    是……什么也没有发生。无数车开过,甚至没有一辆车减速让我进入车道。这意

    味着什么?为什么人们愿意为我做一些大的事情,在这里却不可能让他们为我做

    一件小事?只是稍微减一下速,这样我就可以继续开车?我一直找不到答案,直

    到我读到关于囚徒困境的一次性版本和重复版本的区别,我才恍然大悟。

    我们必须区分那些只参加囚徒困境游戏一次、之后再不见面的参与者,和那

    些反复参与博弈的参与者。第一个版本不可避免地终结于相互背叛。然而,这与

    囚徒困境的重复版本(即重复博弈),本质上是不同的。当我向我的战友提出帮

    助的要求时,他们有意识或是下意识地知道我们会再次进行博弈,而且我会对收

    到的所有恩惠予以报答。在重复博弈中,参与者期待从偶尔帮助他人“获胜”中得

    到奖赏。但某人给我让路时,我没有时间停下来,记下他们的车号,从而可以在

    下次路上遇到时予以报答。这是难以实现的。然而,人们在面对罗伯特·阿克塞尔

    罗德提出的“未来阴影”时,更愿意进行合作——当我们期待进一步的接触,而且

    这确有可能时,我们会改变思考的方式。

    在很多高管培训班上,有一个基于囚徒困境的热门试验。参加者被分成两人

    一组,每个人都拿到500美元,以及一堆上面标着S(沉默)和B(背叛)的卡

    片。同时他们被告知,以下的博弈他们会一起玩50次。这个博弈是关于尽可能少

    地损失美元,游戏的规则意在隐藏这其实是伪装的囚徒困境的事实。如果两个参

    与者都选择了S卡(并同意保持沉默),实验指挥人就会从他们手中的500美元中扣除1美元(如同被囚禁1年);如果二者都选择了B(同时相互背叛),他们都

    会损失18美元;如果一个选择了S,而另一个选择了B,后者就会保留所有的500

    美元,而前者钱包里会扣除20美元。我想强调一下:每一组都会持续进行这个博

    弈50次。

    大多数玩家很快理解了规则——毕竟,他们是企业高管——但这对他们并没

    有什么帮助。由于没能看到重点,他们和那些只进行一次博弈的人有着同样的算

    计,并得出以下结论:无论对方如何做,背叛会是最佳选择。然而当他们继续博

    弈并损失18美元一次、两次、三次,甚至更多次的时候,他们意识到这个策略非

    常错误,因为如果他们持续50次损失18美元,他们不仅会失去全部的财产(最早

    的500美元),而且还会欠实验指挥人400美元。往往到这个阶段,也就是大多数

    人进行到第三轮时,我们开始看到参与者有合作的尝试。参与者策略性地选择了

    S,并希望他们的对手也会受到暗示,同样这么做。只有这样,他们才可以保住

    自己500美元的绝大部分。

    我认为以色列政治家阿巴·埃班的说法是正确的。他说:“历史告诉我们,人

    们和国家只有在浪费了所有其他选项后,才会采取明智的行为。”

    在重复的囚徒困境中,当我们接近第50次时,重点出现了。在此阶段,我可

    以告诉自己,不需要再发出想合作的信号了。毕竟,无论对方如何选择,如果我

    选择背叛,我会损失更少。一旦你开始这么想,你将会开始一个死循环:因为我

    相信第50轮的结果是不可避免的,我意识到自己不应该在第49轮时进行合作,我

    们很可能会背叛对方,所以我也选择背叛。这样的逻辑思维现在也同样适用于第

    48轮。现在我们有了一个新的悖论:如果两个参与者都很理性,也许他们应该在

    一开始就选择背叛。

    因此,逆向推导也许并不合适,只能把事情变得更加复杂。这就是所谓“突击

    测试悖论”或是“老虎悖论”,情况如下。在一个周五的最后一节课上,老师宣布下

    周会有一次突击测试。学生都吓得半死,只有乔大胆地说:“老师,你不能在下周

    进行突击测试。”“为什么不行?”老师问。“这很明显,”乔说,“测试不可能在下

    周五进行,因为如果周四没有测试,我们会知道它一定会在周五进行,这样就不

    算突击测试了。周四也一样,因为如果周一、周二、周三都没有测试,我们已经

    排除了周五,那么测试一定会发生在周四——所以现在我们知道,老师,你对我

    们做不到突击。”虽然突击测试的定义还不那么清楚,老师也被乔说服下周进行突击测试是不

    可行的,但他仍然选在周二对这些过于信任乔的逻辑的学生来了一次突击测试。

    当这一逻辑在可知次数下被反复使用时,它同样也适用于囚徒困境(当我开

    培训班时,我往往不会事先说明博弈会进行几轮),因为参与者会和突击测试中

    的乔一样思考。那种回溯方式只会将我们带入一个死胡同。

    之前提到的罗伯特·阿克塞尔罗德是密歇根大学研究政府科学的学者,但他同

    时也研究数学,并且因参与电脑化操作囚徒困境而出名(你可以在他1984年的著

    作《合作的进化》中读到这些)。他问了许多明智的人,请他们发来重复囚徒困

    境的明智策略,并将规则进行如下定义:如果两个参与者都保持沉默,每人得3

    分;如果两个人都背叛,每人得1分;如果他们意见分裂,背叛者可以得5分,而

    另一方得0分。阿克塞尔罗德宣称每一次博弈会有200轮,并要求人们给出应对策

    略。他说的“策略”是指什么呢?

    在重复的囚徒困境中,有许多的策略可能性。“永远沉默”是最简单的策略之

    一,但这显然不明智,因为对手可以轻而易举地加以利用,使自己的背叛不受惩

    罚。“永远背叛”是一个更加困难的策略。这里还可以选择所有奇怪的替代策略,如一次背叛、一次沉默、扔钱币随机选择“沉默”或“背叛”。

    你现在应当已经清楚,最佳策略应该是根据对手的选择来行动。确实,在第

    一个被奥林匹克电脑化的囚徒困境中,最佳战略被描绘成“以牙还牙”。它也是最

    简短的:在Basic(培基)编程语言中仅占四行。

    那个策略源于阿纳托尔·拉波波特(1911—2007),他出生于俄罗斯,在美国

    工作。根据这一模板,你在第一轮应当保持沉默——也就是装成好人。然后从第

    二轮起,你只需要重复对手在前一轮中的行为:如果他或她在第一轮保持沉默,那么你在第二轮也保持沉默。不必问你能为你的对手做些什么,而是问他们先对

    你做了什么;然后照葫芦画瓢。这个“以牙还牙”的策略平均可以得500分,这是相

    当高的。如果双方都选择沉默,他们每一轮都赢取3分,这意味着每次游戏赢600

    分已经非常好了。这个策略是得分最高的。

    有意思的是,最复杂且描述最冗长的策略往往得分最低。第二次的比赛则突

    出“两次打击一次报复”:如果对方背叛了你,你会先让他们弥补自己的罪过,而当他们再次选择背叛时,你也会跟着选背叛。这比最初的“以牙还牙”策略甚至“更

    好”,但也许对你自己太好了,以至于得分相当低。

    当听到“以牙还牙”策略时,那些对博弈论一无所知的人会抗议说:“这是伟大

    的发现吗?这就是人们通常会做的事情呀。”毕竟,以牙还牙并不是什么让人震惊

    的诺贝尔级的数学发现,只是对普通的人类行为的观察:你对我好,我就对你

    好;你对我不好,我也会这样对你;以牙还牙以及所有类似的行为。

    阿克塞尔罗德进一步发现,以牙还牙策略要想成功,参与者必须遵循以下四

    项规则。

    1.扮演好人。永远不要做首先背叛的那个。

    2.永远要对背叛做出反应。盲目乐观不是好主意。

    3.原谅他人。一旦对手停止背叛,你也应该这样做。

    4.不要忌妒。会有个别几轮你没有取胜,但总体上你会取胜。

    关于囚徒困境的另一个有趣的版本是当博弈由多个博弈者,而非只有两个博

    弈者参与的时候。多博弈者变体的案例之一是捕鲸业。所有经济在很大程度上依

    附于捕鲸业的国家都希望对其他国家的捕鲸业施加严格的限制(沉默战略),同

    时自己的渔民可以为所欲为地捕鲸(背叛战略)。这里的问题很明显:如果所有

    的捕鲸国家都选择背叛策略,结果对所有国家都会是灾难性的(且不说鲸鱼在这

    个过程中可能会遭受灭顶之灾)。这是一个多博弈者囚徒困境的案例。这同样适

    用于植树,或者更加平淡无奇的事务,如公寓楼物业费是交还是不交,这是个问

    题。当然,每个房客都希望,所有的房客都能交物业费——当然除他们自己以

    外。如果是这样,一切都会很好——花园里鲜花盛开,大厅里灯火通明,电梯运

    转正常——而他们一分钱也不用花。当越来越多的房客(最终是所有的房客)开

    始想也许他们也不用交物业费,而且停止交费时,麻烦就出现了。可以想象这类

    公寓楼里的电梯和花园会变成什么样。

    如果德国哲学家伊曼努尔·康德(1724—1804)今天还活着,他会建议我们用

    以下的绝对命令(这是我从康德原话中改编过来的)来解决这一困境:“在你行动之前,想想这个问题:你希望你的行动成为一个普遍法则吗?”康德会期望公寓楼

    的房客说:“我当然不想让逃避交费的想法成为被普遍接受的想法。因为那样结果

    会很难看,所以也许我们最终应该交费。”这很好,但在所有的房客熟悉康德的作

    品之前,我们最好引入一些关于收费的条例。当涉及收费和交税时,人们往往不

    是自愿交费的……即使他们已经读过康德。

    西班牙哲学家何塞·奥尔特加·伊·加塞特在提到类似问题时曾说过,“法律脱胎

    于对人性的绝望”。

    那么,重复多博弈者的囚徒困境的最佳策略是什么呢?当然,事情比过去要

    复杂得多。举例说,“以牙还牙”策略在这里就不适用。当我与一位对手对弈时,我知道他走完了,然后我会由此做出反应;但当我和20位房客对弈时——8位没

    有交物业费,12位交了物业费——我的“以牙还牙”策略会是什么呢?随大溜?等

    所有人交了我再交?一位房客交费是否可以说服我也交费?这在数学上和直觉上

    都很复杂,所以我们现在先把这个问题放一放。第七章 企鹅数学

    本章献给动物——它们是博弈专家,也是演化博弈论领域的明星。我们将讨

    论汤氏瞪羚(Thomson's gazelle)看起来奇怪的行为与利他主义的关系,加入

    企鹅寻找志愿者的队伍,并研究一个来自演化博弈论的定义,它更好地扩展了纳

    什均衡。

    我认为演化博弈论是博弈论分支中最精彩的一支,旨在研究和理解动物的行

    为。

    我之所以会被这个研究领域吸引,是因为和其他事物比起来,动物倾向于几

    乎完全的理性。现在,鼓励数学家制造出试图预测行为的模型的恰恰就是理性。

    看到这些模型与我们的自然现象相符的感觉非常好。

    当我最早开始研究将博弈论应用于研究动物行为时,我处理的最有意思的一

    个问题就是利他主义。

    在1976年出版的《自私的基因》一书中,理查德·道金斯提供了这样一个定

    义:“如果个体在行为中以牺牲自身利益为代价,来增加其他个体的福利,那么这

    个个体……就是利他主义的。”也就是说,如果行为的结果是降低利他主义者生存

    的概率,那么这个行为就被视为利他主义。道金斯事实上在试图为利他主义提供

    可能的解释,因为这个现象看起来与他关于自私的基因的根本概念相冲突。他声

    称,有机体是基因的生存机器,这些基因希望在这样一个利己主义才是有利的竞

    争性世界中能进入下一代。毕竟,如果有机体只对将自己的基因及时遗传至下一

    代感兴趣(我们可以说自我复制是基因唯一关心的事情),利他主义者就不可能

    在进化和自然选择中幸存。然而,自然中有很多利他行为的例子,如母狮子用战

    斗来保护幼狮。道金斯提到汤氏瞪羚在发现捕食者靠近时上下跳跃(弹跳)而不

    是逃之夭夭,他认为,“这种在捕食者面前精力充沛且引人注目的跳跃类似于鸟类

    的报警信号,似乎是为了警告同伴危险降临,但同时显然将捕食者的注意力引到

    弹跳者自己的身上”。瞪羚的行为可被视为自我牺牲且极度危险,其唯一的驱动力

    是希望警告瞪羚群。这只是其中的两个例子。从蜜蜂到猴子,大自然还提供了许多例子。

    正如上文所指出的那样,乍一看,利他主义似乎与道金斯的自私基因理论相

    违背,但事实上并没有矛盾,因为在野外并不存在真正的利他主义。为幼狮而战

    斗的母狮在个体层面上也许是利他的,但从基因上看,她的行为也是极度利己

    的,母狮竭尽全力保护它的幼兽,从而保护了自己的基因(或者说基因携带

    者)。

    汤氏瞪羚的表演

    但是,我们如何解释汤氏瞪羚的行为呢?一只羚羊看到了一头猎豹向兽群潜

    行过来,它有时候会上下跳跃,发出奇怪的声音,而且通常看起来是为了吸引捕

    食者。这是个好主意吗?难道它不应该和其他汤氏瞪羚一样逃走(显然更明智)

    吗?我们应如何解释这一现象?

    不久前,动物学家认为“弹跳”是警告瞪羚群,但后来他们改变了看法。阿莫

    茨·扎哈维(Amotz Zahavi)教授是动物利他主义行为的研究者,他认为跳跃的汤

    氏瞪羚不是在试图警告瞪羚群,而是在向捕食者发出一条信息(或者用博弈论语

    言说是一个“信号”),仅此而已。如果翻译成人类语言,这条信息如下:“捕食

    者,看这里。我是一只年富力强的汤氏瞪羚。你看到我跳得有多高吗?你注意到

    我优美的动作和敏捷的身体吗?如果你真的很饿,你最好去追另一只羚羊(或者

    是一只斑马),因为你捉不到我,你会继续饿下去。听我说,给自己找一些更容

    易的猎物,因为我今天不会成为你的盘中餐。”

    那么真相是什么呢?羚羊跳起来是为了警告瞪羚群,正如之前自私基因理论

    家相信的那样,还是仅仅是为了寻求成为第一名?

    这里有两个可能的答案。一个是数学解答,应用一个潜在的和似乎合理的模

    型,试图描绘一个给定的情境,看一下数学会给出什么样的答案。另一个更加简

    单,看捕食者在现实生活中会怎么做。观察显示,很少有捕食者会去捕捉弹跳的

    羚羊。显然,它们收到了信息。

    一次,当我做关于动物王国里的数学模型的讲座时,听众里有一位男士站起来说:“先生,您完全错了。您给出的模型也许很好,但它们太过复杂。我从来没

    有听说哪只汤氏瞪羚熟悉微分方程或演化博弈论,而且只有极少数狮子上过功能

    优化及分析的课。它们不可能听得懂您的讲座。”

    我回答说,所有的汤氏瞪羚,而且几乎所有现存的捕食者,其实都很了解博

    弈论、微分方程和其他数学模型,只是它们对这些的理解方式和我们人类不一

    样。举例说,虽然我从未听说哪只蜗牛上过对数螺旋线的课,但很显然所有的蜗

    牛都善于此,而且做得非常优美。蜜蜂以最优方式建造它们的蜂房,但它们很可

    能没有应用数学的硕士学位。自然中的动物上不同的学校,它们有一个很棒的老

    师叫“进化”。它是一名优秀的教育家,但也很严厉。如果你失败了,哪怕只有一

    次,你就会被淘汰,不是被学校淘汰,而是被自然界淘汰。虽然残酷,这所学校

    却有着保留住最好学生的优势。

    假设一只未接受教育的兔子有一天醒来,感觉它必须拍拍狼的肩膀,作为对

    自己的挑战。进化在淘汰这只兔子前是不会三思而后行的,因为它虽然让狼吃了

    一惊(同时享受它的恶作剧),但这只调皮的兔子犯了一个可怕的策略性错误。

    结果,那个导致犯错的兔子基因(如果兔子的这个行为确实由其基因决定——这

    一假设是存在争议的),很好地在狼的肚子里排成一行,无法抵达兔子的下一

    代。

    我有时候在想,如果学生因为犯了一个大错,或是几个小错而被大学开除会

    怎么样。那样就只剩下很少的学生,但他们绝对是最棒的。也许这并不是一个坏

    主意。

    羚羊的告别一跳

    所有这些都让我思考。如果跳跃策略如此好,为什么所有的汤氏瞪羚并没有

    习惯性地弹跳?如果它们都这样做,过来寻觅晚餐的猎豹会尽情地享受这样令其

    惊讶的一幕:几十只汤氏瞪羚都在愉快地跳跃着,因为猎豹过来了。在自然界中

    为什么没有这样的演出?答案很简单。只有当你有退路的时候,你才有权力去炫

    耀。是的,年轻的瞪羚跳起来不难,但年老的瞪羚就其年龄而言可能跳得算高,但远不及以前灵活。它可能在最不方便的时刻损伤了自己的脊背,或者落地时太重,扭伤了脚腕甚至折断了一条腿。猎豹可能会对瞪羚的不完美有些惊讶,但很

    快这只年迈的弹跳者就会变成猎豹的点心。

    企鹅和志愿者困境

    很多年前我在电视上的自然频道看过一部很棒的纪录片,里面有一群企鹅抵

    达岸边寻找食物。它们的食物仅仅是那些在海洋里游的鱼。企鹅也可以在海里

    游。问题是海豹也可能在那里游泳,而且企鹅是海豹最喜欢的食物。最好的方案

    是有一只企鹅志愿者首先跳进水里,确保海里是安全的——表面上看。这是一个

    简单的“要么游泳要么沉底”的测试:如果志愿者从海水里出来,呼唤它的朋友加

    入,那么一切都很好;如果海水变红了,那么今天就没有午餐了,至少对企鹅来

    说是这样。自然,没有哪只思维正常的企鹅愿意当志愿者,所以它们都只是站在

    周围等待。

    那种情境的数学模型是一种N玩家游戏,名为“志愿者困境”。从策略上看,这种情境不会形成纳什均衡,因为如果一个或者更多的志愿者挺身而出,你(你

    是企鹅)就不应当站出来。另外,空等既不是纳什均衡,也不是一个好的选项:

    你和所有其他企鹅在饿死之前还要等多久?现在,如果所有的企鹅都选择了永远

    等待的策略,你当志愿者是明智的,因为你只会获益。如果你和大家一起站在岸

    边,你肯定会饿死,但如果你跳进海里,可能一头海豹会把你吃了,或者如果旁

    边没有海豹,你就能吃到鱼而且活下来。这样,当志愿者实际给了你一些生存的

    概率。同时,你也已经看到,所有的企鹅都希望别的企鹅先跳下去。

    志愿者策略不是纳什策略,因为如果每只企鹅都跳下去,那么最后这样做的

    企鹅没有任何风险,因为海豹在吃过一只企鹅志愿者之后,已经不怎么饿了。

    所以你是跳还是不跳呢?答案很简单,我所做的就是一直等到纪录片的结

    尾。结果发现,企鹅应对这样的情境有几种有趣的策略。

    策略一 消耗战企鹅的首个策略就是在岸上等,就像斗鸡博弈的极地版本。它们就站在那

    儿,等着有企鹅先跳下去。这是企鹅自己发动的一场消耗战。结果,有只企鹅跳

    下去了。很难说它们等了多久,有可能是7个小时,但纪录片的编辑仅保留了原

    始录像的7秒。在所有悬念的结尾,有一只企鹅意识到这样等会让自己一直饿下

    去,于是它决定跳下去。我们不能说这个跳水者是一个“志愿者”,因为如果它自

    愿为同伴做出牺牲,它应当一开始就这么做,而不是让所有企鹅都一直这么神经

    紧张。我们可以用数学的方式检测一只企鹅是否会以及何时会成为志愿者——这

    是概率的问题,也就是“混合纳什策略”。结果显示,数学和事实有时候息息相

    关,因为数学模型预测出总会有人先迈出一步,就像他们在现实生活中做的那

    样。

    策略二 比谁慢

    另一个受欢迎的策略是当企鹅团队相对比较大的时候:它们同时跳进水里。

    让我来解释一下,虽然我从没当过企鹅,当然也不可能像企鹅那样思考。情况是

    这样的。为什么500只企鹅要同时跳入海中呢?它们的指导性逻辑是什么?它们

    也许相互告知(用基因语言),那里或许没有海豹,这样很好。但是,即使那里

    潜伏着一头饥饿的海豹,被吃掉的概率是1∶500。这也不差。这个风险是合理

    的,因此企鹅愿意冒这个险。当我最早看到这个纪录片时,我记得当时在想,这

    种寒冷刺骨的蜂拥跳水不是一种纳什均衡,因为如果每只企鹅都跳入水中,特别

    是如果水里有足够的鱼,那只玩儿著名的“系鞋带把戏”并且犹豫不前的企鹅才会

    获益。毕竟,如果很不巧有一只饥饿的海豹正好躲在那里,当不守规矩企鹅的鞋

    带再次被系上时,海豹已经吃饱,而那只慢一步的企鹅就不会有风险了。确实,纪录片显示有一些企鹅不如其他企鹅游得快,但我们并不知道它们是不是杰出的

    数学家,或许它们只是糟糕的运动员。毕竟即使所有的企鹅生来平等,仍有一些

    会比其他游得快。如果企鹅开始考虑游得慢一些,那么所有的企鹅都会放慢速

    度,最终它们会站着不动,这会让我们回到起点:所有的企鹅都站在岸边,没有

    志愿者出现,消耗战再次开始。

    策略三 喂,别推呀!电视中企鹅的第三种策略是最好也是最有趣的,至少很符合我的口味。为解

    释这个策略,我想和人类士兵的情况做一个类比。

    在经过一个月密集训练后,一个连队准备休探亲假。正当他们排队进行最后

    检阅时,他们的长官突然出现,宣布了一个令人不快的消息。连队必须留一名士

    兵在基地执行警卫任务。“我五点后会回来,”长官说,“当我回来时,我希望有一

    名志愿者能站出来。如果没有志愿者,那么谁也不能休假。”

    沮丧的士兵和企鹅的处境类似。每个人都希望有人能为了其他人而当志愿

    者,但如果没有人这样,没人能——在海里或者是在妈妈的餐桌旁——吃上饭。

    士兵可以抓阄或者用其他的方式,但企鹅无法抓阄,更何况在南极洲根本无阄可

    抓。然而士兵和企鹅都找出了一个解决办法。

    有一个正在排队接受检阅的士兵叫麦克斯,他和战友一样,因为这个情境而

    心烦。然而,他几秒后就恢复了情绪,拍了拍乔的肩膀,说:“乔,你当志愿者

    吧。”这对麦克斯来说是一个非常让人惊讶的举动。显然,这对乔和麦克斯都有风

    险。我希望你能看到这一点。我是指,一旦麦克斯提议让乔当志愿者,其他士兵

    很有可能会把矛头指向他,并温和地建议让他而不是乔来牺牲自己。麦克斯的举

    动实在大胆,除非有这样唯一的事实:麦克斯是连队中年纪最大的。他很高,肩

    膀宽大,而且身体也很强壮。所有的士兵都对此非常清楚,因此他们有礼貌地围

    在乔旁边,“乔,你有什么问题吗?麦克斯已经这样告诉你了。你将为了我们其他

    人而留下,就这样吧”。所有人都希望又壮又凶的麦克斯站在自己一边,而乔将很

    可能不由自主地成为志愿者。

    企鹅也可以按照策略三做同样的事情。在围着海岸站了几分钟后,企鹅麦克

    斯走到最小的企鹅跟前,从背后用力地拍了它一下。我通常不太愿意将动物拟人

    化,但我简直都能看到小企鹅在跳进海里时脸上那惊讶的神情。这是一个让人印

    象深刻的场景,可以与电影《卡萨布兰卡》和《热情似火》的结尾齐名。不管怎

    样,企鹅自己制造出来志愿者。重要的是,我们也要记住麦克斯不是一只普通的

    企鹅。这样推其他企鹅的行为对普通企鹅来说有风险,因为当你抬起翅膀推其他

    企鹅时,你可能会失去平衡,而另一只更强壮的企鹅可能会把你推下去。

    我们再稍微多想一下企鹅的困境。我们可以看出它们是在博弈中做博弈。在

    选择志愿者博弈之上,它们在玩“我应当站在谁旁边”的博弈。那只被推的企鹅之所以被推下去,是因为它选择了错误的站立点,离麦克斯太近。所以请记住,当

    在玩推人的游戏时,离大个子远一些。

    我们可以做出合理的假设,动物所谓利他行为几乎总是能找到策略上的解

    释。我有一次用来源于演化博弈论的数学工具构建了一个模型,在不诉诸利他主

    义的情况下,解释了企鹅的实际情况。那只在消耗战中失败的企鹅,那只在比谁

    慢比赛中第一个行动的企鹅,那只被推下水的企鹅——它们都不是因为利他主义

    的理由而跳进水中的。推别人的企鹅冒险一试,因为它很有可能失去自己的平

    衡,但它也不能被称为利他主义者。按照同样的逻辑,那只发现自己独自在水中

    游泳的企鹅也不应因自愿上战场(在这个情况下是跳入水中)而得奖,因为它首

    先从没想过要去当志愿者。

    演化博弈论提供了一个旨在扩展纳什均衡的好概念。它于1967年被英国进化

    生物学家威廉·唐纳德·汉密尔顿(1936—2000)首次提出。但这一理论经常归功

    于对其进行扩展并发展的另一位英国进化生物学家约翰·梅纳德·史密斯(1920—

    2004)。由于有这些先行者,我们进入了等同于纳什均衡的演化博弈论领域,即

    进化稳定策略(Evolutionary Stable Strategy,简称ESS)。

    数学家喜欢用“ε-δ”语言(即数学分析语言),而这对普通人而言太难理解,以至于他们情愿学习古汉语。我们无须诉诸数学分析语言,可以说ESS是一种纳

    什均衡加上另一种稳定条件:如果少量的参与者突然改变他们的策略,那些坚持

    原来策略的参与者则拥有优势。

    如果想了解更多进化和博弈论的关系,我推荐阅读约翰·梅纳德·史密斯的

    《演化和博弈论》。

    插曲 乌鸦悖论

    卡尔·古斯塔夫·亨佩尔(1905—1997)是一位重要的德国裔哲学家,他对科

    学的哲学进行了大量的思考。但他获得国际声望源于他在1940年出版的《乌鸦悖

    论》一书(当时他在纽约生活,并在城市大学授课)。他的困境理论使用逻辑、直觉、归纳、演绎的方法——并都以乌鸦为代价。以下是我的版本。在一个寒冷和下雨的清晨,斯马森教授朝窗外看了一眼,决定他那天不去大

    学了。“我是一个逻辑学专家,”他想,“所以我做的工作所需要的一切就是纸、笔

    和一块橡皮,而且我完全可以在家找到它们。”他坐在窗边,一边喝着乌龙茶一边

    想,“我今天应该研究什么呢?”突然,他看到树上有两只黑乌鸦。“所有乌鸦都是

    黑色的吗?”他思考着,突然瞥见第三只乌鸦并且观察到它也是黑色的。“看起来

    好像是这样。”这一断言应该要么被反驳,要么被确认。但如何做到?显然,每只

    他看到的黑乌鸦将增加“所有乌鸦都是黑色的”这一断言的概率,但他不可能观察

    到世界上的所有乌鸦。不管怎样,斯马森教授决定开始观察乌鸦,希望它们都是

    黑色的。

    所以他坐在窗户旁等待着,但看不到更多的乌鸦。“我想我得出去找乌

    鸦。”他想这么做,但不太喜欢这个主意。毕竟,他在家待着是有原因的,而且大

    雨已经变成了冰雹风暴。突然,他想出一个好主意。他记起来“所有乌鸦都是黑色

    的”这一断言与“任何不是黑色的东西都不是乌鸦”的论证在逻辑上是相等的。请记

    住,他是一位逻辑学教授。聪明且合逻辑的人欢迎就此进行思考,并意识到两个

    断言是等同的。

    因此,斯马森教授不再试图去证实“所有乌鸦都是黑色的”,转而去证实“任何

    不是黑色的东西都不是乌鸦”,而且他不用离开家了。他只需要找出所有不是黑色

    的东西,并确保它们都不是乌鸦。现在,这是一个轻松的工作。

    我们的教授再从窗户看出去,很快找到了无数的例子。他看到一片绿色的草

    地,黄色和红色的叶子落下,一辆紫色的汽车,一个有着红鼻子的男人,一个有

    着白色字母的橘色指示牌,蓝色的天空,以及从烟囱里冒出来的灰色烟雾。突

    然,他看到一把黑色雨伞。这让他惊讶了一阵子,但他很快恢复正常并提醒自己

    他并没有证明所有黑色的东西都是乌鸦,而是“任何不是黑色的东西都不是乌

    鸦”——仅此而已。

    现在他完全放松了,待在家里,没有淋雨。他继续从窗户外看出去,观察大

    街上,找到无数既不是黑色也不是乌鸦的东西。他对自己的工作很满意,在笔记

    本上写下:根据我广泛的研究,我可以几乎完全肯定地声明所有乌鸦都是黑色

    的。证明完毕。

    他有犯错吗?如果有,你能指出斯马森教授的错误吗?第八章 拍卖理论的简要介绍

    在这一章开始,我会展示如何将100美元的钞票拍卖到200美元。接下来,我

    会介绍上一节关于拍卖理论的简要课程,这一理论是博弈论的旁枝。我们会审查

    不同类型的拍卖,试图理解赢者诅咒的现象,并找出哪一次拍卖获得了诺贝尔

    奖。 (本书分享更多索搜@雅书)

    100美元值多少?

    起初,这个顺序性博弈被称为“美元拍卖”,但为了让它变得更加有意思(毕

    竟,由于通货膨胀,美元已经不再像以前那样值钱),让我们以100美元的钞票

    为例。至于谁发明了这个博弈,众说纷纭。有人说是马丁·舒比克、罗伊德·沙普

    利和约翰·纳什在1950年发明了这个博弈。不管怎样,在耶鲁大学教书的美国经济

    学家舒比克在1971年发表的一篇文章中讨论了这个博弈。

    博弈的规则很简单。一张100美元的钞票被拍卖,出价最高的人将得到它。

    与此同时,出价第二高的人也要支付他出价的金额,但什么也得不到。

    我经常在上课时玩这个博弈。我有次来到课堂上,像前面描述的那样,拿出

    100美元来拍卖。我承诺会把钞票卖给出价最高的人,哪怕他给出的价格很低。

    这让所有的学生都欢呼雀跃。总会有学生出价1美元,并且认为自己赚到了人生

    中的大便宜。结果如何呢?如果课堂保持安静,那个学生真的会获得丰厚回报。

    但问题是这从未发生过。一旦他们发现有人想用1美元抢走100美元,总会有人出

    2美元;毕竟,他们凭什么让其他人赢,自己却吃亏?有些人想到这个就局促不

    安。

    一旦有人出价2美元,第一个出价的学生将损失1美元,因为他必须付出自己

    出价的金额并且空手而归。自然,出价第二高的学生现在必须出价3美元。一旦

    有第二个玩家加入这场游戏,木已成舟。我,作为卖方将获益,而无论怎样,玩

    家都会有损失。不可能有两种方式。举例来说,如果有一个玩家提出用98美元买我的100美元,而另一个玩家提出用99美元来买。那么出价98美元的出价人最好

    出价100美元,因为在此情况下他很明显会损失98美元。对他而言,最好的交易

    是拿出整整100美元,在不赢不输的情况下退出游戏。但是,在他出价100美元之

    后,那个出价99美元的玩家会遭遇真正的打击,因此(尽管这看起来实在荒

    谬),他必须出价101美元,使自己只出1美元,而不是损失99美元。此外,我作

    为卖家,刚把201美元减去100美元(****的价值)的金额装入荷包,获得

    101美元的净收入。

    这个博弈何时结束?从数学上看,永远不会结束。从现实角度看,当以下情

    况之一发生时,这个游戏才会结束:第一,玩家没钱了;第二,下课铃响,课堂

    结束;第三,一个玩家学聪明了,退出博弈,竞标失败。

    这个博弈完美地显示了好的战术如何有可能变成糟糕的策略。数学逻辑声

    称,竞标者应当在每一阶段都提价,但这种逻辑会带我们走多远?难道损失4美

    元时就退出不比损失300美元来赢一张价值100美元的钞票要更聪明?

    一次,当我在战略思考训练营中构建这个博弈时,我仅用了2分钟,就用拍

    卖100美元的方式获得了一个290美元的出价(每次出价都以10美元为单位)。我

    注意到游戏参与者很快忘了这个拍卖是关于什么的,仅仅为了相互竞争。他们所

    关注的全部是自己赢,同时不让其他人赢。

    人们的表现有时候确实相当古怪。还有一次当我做这个试验时,一个人之前

    完全不参与,直到竞标价格达到150美元时,他突然出价160美元让所有人都大吃

    一惊。他为什么这样做?他完全可以走进一家银行,用160美元换100美元的钞

    票。他究竟为什么选择参加这个博弈呢?

    我的一位朋友参加了哈佛大学为高级商人举办的一场研讨会。他告诉我他靠

    拍卖的100美元收获了500美元。难道这些参与者仅仅是因为不理性?未必如此。

    也很有可能是这500美元对这些成功的商人而言不算什么,通过出价500美元,他

    想对其他参与者示意他决定战斗到底。在我们生活的年代,这是一个非常重要的

    信号,因为这些商人总有可能会再次遇到类似的情况(他有可能将投资的500美

    元作为开支而一笔勾销,这很合乎道理)。

    人们不愿意退出博弈,仅仅因为他们已经在此做出巨大投资,基于这种理由而做出的行为在我们的日常生活中时时发生,既有大事,也有小事。举例来说,当你给有线电视公司打电话,等待客户服务人员接听电话时,就是这样的行为。

    你在线上等待很长时间,话筒里播放的好听的音乐帮你度过这段时间,但没有人

    接听电话。你通常会怎么想?“好吧,我已经等了这么久,现在挂断就太可惜

    了。”所以你继续等待。你等呀等,这个音乐开始变得让人极为心烦。但你等待得

    越久,你的放弃就显得越发愚蠢,因为你已经付出如此多的时间。

    按照同样的动态逻辑,我们可以看到,当一个国家资助的机构对一位商人发

    起的项目投资2亿美元之后,会在项目失败后决定再给他1亿美元,以拯救这个项

    目。这是同样类型的错误。

    最好的方法是当你遇到这种“出售100美元游戏”时,根本就不要参与;如果你

    不小心参加了,最好的办法就是马上退出。有人有次提议了一个赢得博弈的“安

    全”策略。你第一次出价就应当是99美元。确实,你不可能有可观的收益,但能赢

    就很好了。从我个人的角度,我不会建议这个策略。总会存在一种可能性就是有

    人会突然出价100美元换100美元。他为什么会这样做?没有任何理由。

    不管怎么样,仅仅因为我们已经损失了很多而继续参与博弈永远都不是一个

    好主意。就跟其他事情一样,古希腊人早就知道——在他们历史悠久的概念中已

    经暗示“即使神也无法改变过去”。

    我将用一个小小的脑力游戏来结束这个关于现金拍卖的探讨,类似的游戏也

    在一家久负盛名的军事科学院里进行过。用上文中描述的方式对20美元的钞票进

    行拍卖,每次出价至少为1美元。有两名军官,其中一人出价20美元,另一位将

    出价提高到21美元。在这个时候,出价20美元的那位突然迈出了惊人的一步,将

    出价提高到41美元。于是游戏结束。(为什么?如果他出价42美元,他会损失22

    美元。损失21美元总比损失22美元好。)

    拍卖可能是博弈论最古老的一支。人们都说,最早的拍卖是约瑟的兄弟将他

    和他的彩衣卖给奴隶贩子。公元前5世纪的希腊历史学家希罗多德记录下了在他

    的那个时代进行的拍卖。那时,女性被卖入婚姻。最漂亮的女性往往最早被拍

    卖,在卖家获得不错的价钱之后,他会将剩下的女性从美到丑降序拍卖,而出价

    也随之下降。那些毫无吸引力的女性甚至需要花钱来买丈夫,这意味着这些拍卖

    也有负面竞拍。拍卖在罗马帝国时期也很流行,以至于在公元193年,整个帝国都被拍卖。

    狄第乌斯·尤利安努斯赢得了拍卖,但在两个月后就遇刺身亡,这显示赢得拍卖也

    并非总是值得庆祝的。

    拍卖方法有很多种,主要的版本包括英式拍卖、荷兰式拍卖、密封拍卖和维

    克瑞拍卖。

    英式拍卖

    在英式拍卖中,物品以基础价被拍卖,其价格随着需求的上涨而不断上升,直到出价最高的竞标人拿下。竞标人可以通过电话竞拍。众所周知,有名和有钱

    的人往往不愿意出现在竞价大厅,因为他们的出现就有可能让价格高涨。

    在一种英式拍卖的版本中,价格持续上升,当价格高到难以接受时,竞标人

    退出竞标,而最后剩下的那位赢得物品。这种方法给参与者提供关于所有竞标者

    如何对物品估价的信息。

    荷兰式拍卖

    在这种拍卖方法中,物品以最高价竞拍,其价格不断降低,直到一个买家认

    为价格对自己合适从而购买物品。这一拍卖体系被命名为“荷兰式”,因为这是荷

    兰人卖花的方法。

    一次,我在一家波士顿古董店里看到一场有趣的荷兰式拍卖。商店里的每件

    物品都有一个价签,同时也标明了物品最初放在商店里的日期。你需要支付的物

    品价格是由价签上标注的价格减去一个折扣,而这个折扣取决于物品在商店里待

    了多长时间——待得越长,价格越便宜,而这个折扣可以达到原始价格的80%。

    当一个波士顿人看到一把中意的椅子此刻标价为400美元,他有可能得出理性的

    结论:这个价格将在一个月后下跌,最好等等再出手。他是对的,前提是没有其

    他人同时会买这把椅子。英式拍卖vs荷兰式拍卖

    那么出现一个有趣的问题:是英式拍卖好,还是荷兰式拍卖好?

    假设我们想用荷兰式拍卖的方式出售一本非常特殊的书(如由詹姆斯·乔伊斯

    亲笔签名的《尤利西斯》),我们将起拍价定在10000美元,每10秒降100美元。

    这一销售方式有可能让潜在买家极为苦恼,因为一旦有人叫停,书就卖出去了。

    显而易见,如果一个人认为他能从这本书中得到的快乐等同于9000美元,他会等

    到价格降到这个水平再出价(在这本书还没有卖出的情况下)。

    然而,在英式拍卖中,你有时候可以用低于你原本打算支付的价格来获得物

    品。举例来说,没有人在乎作者亲笔签名的原版,因此我们出价700美元是最高

    价,这对我们来说还不错:因为我们用700美元换取了我们原本愿意用9000美元

    买来的东西。另外,这种方法鼓励人们一再增加自己的出价,而他们这样做的主

    要原因是人类的竞争倾向。假设你愿意出9000美元买这本书,但发现也有人出价

    9000美元。你会出价9100美元吗?很可能会,因为这只比你的初衷高出100美

    元。但是另一位出价人的初衷也一样,会提价到9200美元,这时你不得不再将价

    格提到9300美元……就这样继续下去,谁知道会在哪里停下?

    在英式拍卖中,价格会持续上涨的另一个原因是在销售中获取的信息。例

    如,一位参与者感觉这本书可能值9000美元,但他很不确定。这个价格有可能被

    夸大吗?也许这本书也就值这一半的价钱?如果他看到其他人出价8500美元,他

    会对自己的评估更加确信。这会向他表明,他的观点并非完全不现实。拍卖商往

    往会利用这一点,他们安排一个虚假的竞买人将价格推高。

    关于两种拍卖方法哪种更好,人们对此有着严重的分歧,但显然英式拍卖更

    受欢迎(我还见过一些拍卖,开始的时候用荷兰式拍卖法,一旦到达某个价格,就开始使用英式拍卖法)。

    密封拍卖

    一些资金极为大额的项目(如油田、银行、航空公司等)往往用以下方法拍卖:潜在的竞价人可以在给定的竞标时间内准备出价,并将价格写在一个密闭信

    封里。在指定的日子里打开信封并宣布获胜者。这是决定阶段。这些拍卖通常得

    遵守冗长且单调的规则,但阅读这些规则可能对竞价人很合算,因为他们有可能

    在此找到一些惊喜。例如,规则中有时候会说,卖方无须挑选出价最高的竞价

    人。

    鉴于我们已经提到油田,现在是时候了解一下“赢者的诅咒”现象。

    三位石油工程师于1971年在一篇研讨会文章中最先记录下这个现象,他们是

    埃德·卡彭(Ed Capen)、鲍伯·克拉普(Bob Clapp)和比尔·坎贝尔(Bill

    Campbell)。这三位指出,如果你赢得了拍卖,你应该问问自己:“为什么其他出

    价人不认为我刚拍下的油田比我出的价更值钱呢?”从数据上看,这个想法很简

    单。

    举例说,一家石油公司的业主破产了,其油田被拿出来拍卖。有10家公司用

    密封拍卖的方式出价如下:80亿美元、72亿美元、70亿美元、130亿美元、113亿

    美元、60亿美元、80亿美元、99亿美元、120亿美元、87亿美元。

    谁知道这座油田真正的价值是多少?谁能猜出哪怕是近期的油价?没有人。

    然而一般来说,竞价公司都会在出价之前雇专家研究这个问题。与此同时,估计

    油田的价格会是竞拍价格的平均数也是符合逻辑的。假设最高出价(130亿美

    元)接近油田的真正产量年景是没有道理的,但他将(几乎)肯定赢得拍卖。然

    而,获胜者最好等一等再庆祝,需要花点时间反思一下。

    维克瑞拍卖

    (或第二价格密封拍卖和诺贝尔奖)

    维克瑞拍卖是因1996年诺贝尔经济学奖得主、加拿大裔的哥伦比亚大学经济

    学教授威廉·维克瑞而得名的,具体操作如下:竞拍者对他们想购买的东西通过密

    封拍卖的方式出价,出价最高的人获胜。但与其他普通拍卖方式不同的是,获胜

    者并非支付最高投标价,而是支付第二高的价格。这里的逻辑是什么?为什么这居然符合逻辑?为什么中标人要支付比他最终

    竞拍的价格少的金额?为什么拍卖行不收取高价的出价呢?

    我相信,使用维克瑞拍卖方式的理由之一是,我们都知道很多人是不理性

    的,有可能错误地出高价,认为他们实际上永远不会支付这个价格。比如说,我

    可能会出价2万美元来购买有马塞尔·普鲁斯特签名的《追忆似水年华》的初版,而事实上我只愿意支付1万美元——毕竟他是普鲁斯特,而且我也喜欢买书。这

    有什么错呢?我相信,这个策略将确保我会获胜,并且我最终会支付出价第二高

    的价格,这个价格肯定会比我的更符合逻辑。问题是,来自波士顿的埃德加·克林

    顿(Edgar Clinton)也有一模一样的想法,所以他出价19000美元。这意味着我获

    胜了,但最后要比我实际愿意支付的价格多9000美元。毕竟,我买的只是一本

    书,而不是一个书店。

    也许我们应该给出自己现实的评估?

    这个难题的答案很简单也令人惊讶,同时会让我们接近维克瑞拍卖如此重要

    的原因:第二价格拍卖会使拍卖者拍出他们愿意支付的(真正的)最高价格。

    让我们更准确地复述一下。在维克瑞拍卖中,拍卖者的优势策略是找到拍卖

    物品对他们的真正价值(对参与者而言,当一个战略比其他战略更适合一个参与

    者时,无论其他参与者如何参与,都会出现战略优势)。在这个情况下,诚实是

    最佳的策略。我们不需要用数学方法来证明。你要做的就是想一想,如果拍卖者

    出价高于或者低于被拍卖物品对他们所值的价格会怎么样,你会发现,在两种情

    况下,收益都比给出真实的价值要少。

    早在1961年,维克瑞就对此进行了最初的分析,但他直到1996年才获得诺贝

    尔奖。遗憾的是,威廉·维克瑞没能参加在斯德哥尔摩音乐厅里举办的颁奖典礼:

    他在接到自己成为诺贝尔奖候选人通知的三天后去世。

    插曲 纽科姆悖论

    所谓“纽科姆悖论”是一个著名的实验,与概率和心理学紧密关联,以加州大

    学洛杉矶分校的物理学家威廉·纽科姆命名。这一思想实验不同于其他实验,确实值得被称为悖论。具体介绍如下。

    我们面前有两只盒子。一只透明的,其中装有1000美元;另一只不透明,有

    可能装有100万美元或者什么也没有——我们不得而知。我们可以拿上1000美元

    高高兴兴地回家,也可以选那个有可能装有100万美元或是分文没有的不透明的

    盒子,再或者抱上两个盒子就跑。当然,第二个选择更好。问题是这个实验是由

    一位预言家来操作的,他有着超能力,可以看到我们的想法,甚至会先于我们知

    道我们会做什么样的选择。如果预言家预感到我们会拿走不透明的盒子,他会放

    进去100万美元;但如果他预知我们会拿走两个盒子,他会在不透明的盒子里什

    么都不放。

    现在,假设有999人已经参与了此实验,而且我们知道每当有人拿走两个盒

    子时,不透明的盒子里都会是空的;但每当参与者只选择拿不透明的盒子时,他

    们就会成为百万富翁。你会做什么决定?

    决策论包括两个看起来自相矛盾的原则。一是合理性原则,根据这一原则,我们只应拿走透明的盒子,因为我们已经看到之前发生的事情。二是显性原则,根据这一原则,我们应拿走两个盒子,因为它们就在那里,如果不透明的盒子里

    有100万美元,我们就会拿到;如果里面分文没有,我们至少还有1000美元。这

    两个原则相互矛盾,给我们提供了完全不同的建议。

    许多优秀人士都对这个著名的试验进行过讨论,包括哈佛大学哲学家罗伯特·

    诺齐克、科普杂志《科学美国人》数学编辑及《爱丽丝梦游仙境》的译者之一马

    丁·加德纳。两人都认为他们应该两个盒子都拿,却给出非常不同的理由。

    如果我面对这个实验——前提是我相信预测(而非预言,因为我是一个理性

    科学家),并且目睹了999个案例的结果反复出现——我会拿不透明的盒子,而

    且(有可能)得到1001000美元。然而,这个问题仍然广受争议。加德纳认为这

    里没有悖论,因为没有人能如此准确地预测人的行为。然而,如果你见过有人能

    如此准确地预测人的行为,那么这就是一个符合逻辑的悖论。所以我们该怎么

    做?两个盒子都拿还是只拿不透明的那个?

    你来决定。第九章 斗鸡博弈和古巴导弹危机

    在这一章里,我们会接触斗鸡博弈,由两个纯粹的纳什均衡组成——使结果

    极难预测。该博弈与边缘政策的艺术紧密相关。

    由两人参加的斗鸡博弈有一个简单且流行的版本。两个摩托车手朝对方开过

    去(如果我们在拍电影,他们最好用的是偷来的车),首先逃避相撞的那方输掉

    游戏,并永远被称为“胆小鬼”。那个毫不退缩的车手在博弈中获胜并成为镇上的

    英雄。如果两个车手都不逃避,他们会撞上彼此而丧生。当詹姆斯·迪恩在世时,这个博弈风靡一时,并在不少电影中都有呈现(如1955年由詹姆斯·迪恩和娜塔莉

    ·伍德主演的电影《无因的反叛》)。

    当然,每位博弈者都希望对方是胆小鬼,这会使自己成为勇敢的赢家。然

    而,如果双方都决定要表现勇敢,那么两辆摩托车的对撞将是对两人最糟糕的结

    果。和许多其他危险的博弈一样,我的个人选择是逃避战略:避开。我想我们都

    知道一些最好选择躲避而非参与的博弈。但如果我们处在一种没有其他选择而又

    不得不参与的情况下,该怎么办?

    设想以下的情节:我站在我的车旁边,顺着马路望过去;我的对手在不远处

    也和我一样,朝我看过来;人群中有一位我想引起注意的女士,而且我莫名感觉

    到,她不会欣赏我,且会明智地离去。我应该怎么做呢?

    我们的两位博弈者(以下称为A和B)可以从两个非常不同的策略中选一个:

     ......

您现在查看是摘要介绍页, 详见PDF附件(2303KB,126页)