概率的烦恼.pdf
http://www.100md.com
2020年2月6日
![]() |
| 第1页 |
![]() |
| 第9页 |
![]() |
| 第12页 |
![]() |
| 第28页 |
![]() |
| 第48页 |
![]() |
| 第135页 |
参见附件(2061KB,152页)。
概率的烦恼,这是一本关于量子力学的书籍,作者是汉斯·克里斯蒂安·冯·贝耶尔,全书分为四个章节22个小节,读者可以在这本书中完整的了解量子力学。

内容提要
因为预测以及在科技领域的广泛应用,量子力学被认为是成功的科学理论之一,但也是被误解的理论之一。在被创立后的近一个世纪,量子力学仍旧充满了争议。通过量子贝叶斯理论(QBism)解释量子理论中的悖论和谜题,本书为非的读者阐述了量子力学深远的含义、如何理解量子力学和量子力学如何与这个世界相互作用。QBism用对概率的全新理解去改造量子力学中的传统特征。贝叶斯概率与标准的“频率概率”不同的是,它是观察者对未来将要发生的一个事件或者一个命题的信任程度的数值测量。相比于频率主义,量子贝叶斯理论的优势在于它能够处理单个事件,它的概率估计可以根据获得的新信息去更新,并且可以包含“频率概率”的结果。但重要的还是与量子理论相关的奇怪之处——如两个原子可以同时在不同的位置,信号可以传播得比光更快,以及薛定谔的猫可以同时处于死和活的状态的想法。用直白的语言而不是方程,贝耶尔用一种通俗的方式,揭示了量子力学的意义,发现了认识物理学的新途径。
目录预览
第一章 量子力学
第1节 量子力学的诞生
第2节 光的粒子
第3节 波粒二急性
第4节 波函数
第5节 “最优美的物理学实验”
第6节 见证奇迹的时刻
第7节 量子不确定性
第8节 最简单的波函数
第二章 概率
第9节 概率的烦恼
第10节 贝叶斯牧师的概率
第三章 量子贝叶斯理论
第11节 量子贝叶斯理论使事情明晰
第12节 量子贝叶斯理论拯救薛定谔的猫
第13节 量子贝叶斯理论的根源
第14节 实验室中的量子怪异
第15节 物理现象都是定域的
第16节 信念与必然
第四章 量子贝叶斯者的世界观
第17节 物理和人类经验
第18节 自然定律
第19节 石头反踢一脚
第20节 现在的问题
第21节 一张完美的地图
第22节 未来之路
量子力学是什么
量子力学(Quantum Mechanics),为物理学理论,是研究物质世界微观粒子运动规律的物理学分支,主要研究原子、分子、凝聚态物质,以及原子核和基本粒子的结构、性质的基础理论。它与相对论一起构成现代物理学的理论基础。量子力学不仅是现代物理学的基础理论之一,而且在化学等学科和许多近代技术中得到广泛应用。
19世纪末,人们发现旧有的经典理论无法解释微观系统,于是经由物理学家的努力,在20世纪初创立量子力学,解释了这些现象。量子力学从根本上改变人类对物质结构及其相互作用的理解。除了广义相对论描写的引力以外,迄今所有基本相互作用均可以在量子力学的框架内描述(量子场论)。
概率的烦恼截图


概率的烦恼:量子贝叶斯拯救薛
定谔的猫
[美]汉斯·克里斯蒂安·冯·贝耶尔 著
郭武中 阮坤明 译
中信出版社目录
前言
第一章 量子力学
第1节 量子力学的诞生
第2节 光的粒子
第3节 波粒二象性
第4节 波函数
第5节 “最优美的物理学实验”
第6节 见证奇迹的时刻
第7节 量子不确定性
第8节 最简单的波函数
第二章 概率
第9节 概率的烦恼
第10节 贝叶斯牧师的概率
第三章 量子贝叶斯理论
第11节 量子贝叶斯理论使事情明晰
第12节 量子贝叶斯理论拯救薛定谔的猫
第13节 量子贝叶斯理论的根源
第14节 实验室中的量子怪异
第15节 物理现象都是定域的
第16节 信念与必然第四章 量子贝叶斯者的世界观
第17节 物理和人类经验
第18节 自然定律
第19节 石头反踢一脚
第20节 现在的问题
第21节 一张完美的地图
第22节 未来之路
附录 量子力学的四种其他解释
后记
版权页献给芭芭拉(Barbara)前言
退休后,我成为一名量子力学补锅匠。在大学里教了五十年的量子
力学,研究生涯中玩弄着数学的奇技淫巧,挣扎着通过各式各样的报
告、文章、书籍以及电视节目将量子物理福音带给普罗大众之后,量子
力学给我的人生留下了深深的印迹。它点缀了我思考宇宙的方式。
然而,自从高中开始,在我发现乔治·加莫夫(George Gamow)的
经典故事集《汤普金先生》(Mr.Tompkins stories )中所描绘的量子撞
球和量子丛林的魔幻世界之后,我备受量子力学带来的不安情绪的折
磨。到目前为止,它行之有效,且从未让我抑或是其他人失望。然而,尽管使用它并且在大学里教授它,我内心深处却觉得自己并没有真的理
解它!我感觉自己不过是在重复着量子先哲们精心设计的步骤。像所有
物理学家一样,我熟悉牛顿物理,也即经典物理,且当情势需要时,我
可以如同传道者一样引经据典,对答如流,飞快说出它的教令、篇章,口若悬河地去描述它,然而我却从未能这样熟悉量子力学。量子力学的
奇幻之处并不在于它数学式的复杂,而在于与生俱来的的悖论和难解之
谜。
其中最著名的谜题莫过于薛定谔的那只倒霉的猫的故事——根据量
子力学的假设,这只猫同时处于既生又死的状态。其他的难解之谜包含
了这样一条论断,即一个量子粒子可以在不同的位置上被同时观测到,这意味着粒子表现得像波一样,波则像粒子一样,而信息则似乎可以瞬
时传输。总而言之,这些谜被称为量子奇异(quantum weirdness )。
诺贝尔奖桂冠获得者——理查德·费曼给予我安慰。尽管他是二十
世纪最顶尖的量子物理学家,但是仍旧抱怨“没有人真的懂量子力学”,包括他自己!然而他这个极其悲痛的自嘲并未给予我太多的安慰。
随后,意外的事出现了。就在我计划着退休且从自己不会与量子力
学相处愉快的那种悲伤论断中撤退时,量子信息前沿领域专家克里斯托
弗·福克斯(Christopher Fuchs)的文章让我犹豫不决。尽管我并不是很
懂他的文章,但是这篇文章看上去很鼓舞人心。按照科学圈子的传统,我邀请他来到我的学术之家——弗吉尼亚州的威廉·玛丽学院做了一个
报告。他接受了邀请,因而我开始在他帮助下寻找量子力学的新解释。
它被称为量子贝叶斯理论,一语双关地简写成QBism,这么做的原因,我将在这本书中解释。这些年量子力学使我受益匪浅,且它激发了许多
设备的发明,这些发明逐步衍生出改变我们生活的整个工业,而量子贝
叶斯理论与量子力学的这些技术方面的应用无关。取而代之的是,量子
贝叶斯理论不过是在重新解释该理论的基本部分并赋予它们新的含义。
当我和克里斯托弗成为朋友之后,他很耐心地教导我如何驱散量子
奇异的迷雾。在一段时间里,我们相遇在一些国外的会议和研讨会上,诸如在瑞典古堡、加拿大高科技智囊团、瑞士山巅酒店以及巴黎的某个
阴郁的礼堂——每个地方,物理学家聚在一起争论着量子贝叶斯理论的
是与非。克里斯
[1]
和我联系密切,我们通过无数的电子邮件交流,我
们开怀畅饮。如晨曦照在身上加深了我对量子贝叶斯理论的理解。
尽管量子贝叶斯理论激进,但它并不难懂。我如此缓慢地才将它拥
入怀中,是因为传统的量子力学的成功,尽管存在着各种奇怪之处,但
是却令人震惊地解释了自然现象以及给出了可靠的预测。如同我这一代
人一样,我在一个传统的、被笑称为“闭嘴吧,快去计算”的物理学院接
受教育。我们被告知接受量子力学是一个事实,使用它去解释实验和设
计小物件,而不必担忧它的深层含义。
“运用它”是“闭嘴吧,快计算”的更礼貌的表述方式。我们被鼓励着
先搁置哲学上的顾虑,取而代之去成功解决实际问题。这种心态需要一点时间去适应。
我们这种自负的态度在千禧年之际伴随着量子信息理论的成熟而开
始改变,这个理论揭示了量子力学未知的魔力。这些被用于一些非常炫
酷的应用中,诸如量子加密(创造一种牢不可破的密码)和量子计算
(解决曾经被认为不可解决的问题)。前者已经有商业上的实现,而后
者据信不远的将来会变为现实。受科技上巨大进步的鼓舞,物理学界开
始用新的视角审视量子力学的真正的含义。年轻的研究者将不会因为表
达出对它的基础的研究兴趣而被当作白日梦者嗤之以鼻。赞扬克里斯和
他的合作者的研究成果受到关注和赞扬,虽然这是他们应得的,如同搅
拌着一个长久以来在炉眼上文火慢炖的锅。
当我看到量子贝叶斯理论的思想只是缓慢地在物理学界中传播时,我意识到是时候去为那些并不能轻易理解数学公式和方程的人写这本书
了。
大约25年前,在一本关于单个原子壮观的新图像对物理学的影响的
书中,我并非确信而只是非常期待地写道:“当前我们正在建立的对原
子理解的纽带……将赋予它更深的意义,直到某天一个意义深远而简单
地想法将解开量子的所有谜团。”当然,那一天还未到来,但是毫无疑
问,正如二十世纪显微镜学的进展使我们对原子有了更多了解,意义深
远而简单的量子贝叶斯理论将在二十一世纪促使我们对量子有更进一步
的理解。
本书第一章“量子力学”,主要以非数学的术语介绍传统的量子理
论。为了让读者对量子理论有更直观的感受,我通过人们熟悉的事物或
者日常经历这样的隐喻和类比方式来传达理论直观的意义。
第二章“概率”,在这章中我将转向讨论对概率的解释,通过比较我
们中学学习的“频率论”的方式解释概率与不太熟悉的贝叶斯概率之间的
差别。这些讨论的核心就是形式化的数学概率理论与其在现实世界应用之间的基本的但常常被人们忽略的差别。
在做好这些铺垫之后,本书的核心部分将描述如何将量子力学和贝
叶斯概率结合成量子贝叶斯理论,以及如何用这种新的观念来解决量子
奇异。
最后,“量子贝叶斯者的世界观”这一章稍微有些偏哲学,主要涉及
我们从量子贝叶斯理论中获得的最有意义的教训,或者说它的更深层的
意义,这是本书的重点。量子贝叶斯理论意味着一直以来的对世界的科
学观的支柱(另一支柱是相对论,译者按)看法的改变。基于量子贝叶
斯理论的观点,我们将在本章中接触到下面这些问题:什么是“自然规
律”的本质;这些规律能完全决定宇宙的演化吗;我们有自由意识去影
响这种演化吗;在物质世界中,我们既是其中的一部分又是观察者,我
们与物质世界的关系又是怎样的;什么是时间;人类认知的极限在哪
里;展望量子贝叶斯理论发展的前景。
量子贝叶斯理论并非旧酒装新瓶,也不仅仅是量子力学的另一种解
释。量子力学装饰了我的世界观,而量子贝叶斯理论改变了它。第一章 量子力学
[1]
第1节 量子力学的诞生
如量子力学创造者——德国物理学家马克斯·普朗克(Max Planck,1858—1947)所言,量子的诞生是“绝望时的孤注一掷”
[2]。1900年前
后,公共照明和私人照明由气体向电力过渡所带来的技术挑战,鼓舞着
物理学家去探索一个灼热的物体是如何发光的。当一个热的物体发光
时,如燃烧气体的火焰、发光灯泡的金属丝或者太阳会散发出不同颜色
的光。1900年,光已被人熟知为某种波,尽管当时并不清楚是什么在
动。光波如同水波和声波一样,由它们的振幅、波高以及频率来描述,而频率指的是记录者在一秒钟内记录的完整周期的数目,从一个波峰到
下一个波峰出现的过程被称为一个完整的周期
[3]。我们裸眼是看不到
这些周期的,但我们知道的是不同颜色的光线频率是不一样的。红光对
应着缓慢振荡,换言之就是低频,蓝光则表征着高频,即剧烈振荡(记
住,为了回想起红色是否意味着慢或者快的振荡,要记得那些比彩虹光
的振荡频率低的光被称为“红外”。相应英文前缀infra 表示着红外的意
思。比彩虹光频率高的光是紫外光,英文中一般用前缀ultra- ,意味超
出)。如同自然界常见的那样,在许多颜色光混合在一起的情况下,物
理学家会问:光的强度和频率有什么关系?用通俗的话来说,就是在彩
虹中,释放了多少红光,释放了多少黄光和蓝光,等等。
在普朗克所处的时代,实验家争相测量理想实验条件下光强和频率
之间最精确的关系图。当把频率设为横坐标轴,能量密度或者亮度设为
纵坐标轴时,这样的“辐射曲线”看起来像一座小山。释放出来最亮的光的颜色决定了山峰在哪里。举例来说,太阳光的辐射曲线的波峰就在光
谱的黄色部分。如图1.1,记录下来的红外以及红光并没有释放出太多
的能量。沿着更高频率方向过去,辐射曲线逐步上升,在黄色部分达到
了最高值,随后因为光的强度在蓝光、紫光以及不可见的紫外光处逐步
减弱而使曲线下降。
频率图1.1
理论家争相从基本物理原理出发去解释辐射曲线。普朗克在这个问
题上花费了数年时间,却只取得部分成功。在19世纪即将结束的几个月
里,他尝试着采用统计的手段,而这正是他之前所鄙夷的。
山形曲线在概率论和统计领域是很常见的。举个例子,考虑多次掷
一对骰子,并且画出你掷出2点、3点、4点一直到12点的次数。图1.2横
轴代表掷的值(两个骰子点数之和)——从2到12,纵轴则代表着每个
值出现的次数。可以肯定的是,你将最终得到一座小山,尽管并不是很
完美对称的,但是在两端会很低,而在靠近中间逐步上升直至在中间的
时候取得最大值,即在等于7的地方。关于这个形状的解释是基于如下思想,即实现给定的掷得点数方式的数目。只有一种方式获得2点(1,1),也只有一种方式获得12点(6,6)。
但是7点则能以不超过六种的方式获得:(1,6),(6,1),(2,5),(5,2),(3,4)和(4,3)。中间值3,4,5和6以及
8,9,10和11也是一样,每个值获得的方式都少于6种。当各种组合都
是平等出现的时候,获得方式最多的点数将会赢,因此图像中间的峰,即在7点处,就可以很合理地得到解释。
图1.2
普朗克开始对辐射曲线做类似的事情。为此,他不得不把一个连续
性问题转换成一个离散问题。骰子试验中横轴和纵轴都涉及数量,即两
者都测量为简单整数。与此相反,在辐射曲线中,光的频率则被测量为
从0到无穷的实数[彩虹并不只是由赤、橙、黄、绿、青、蓝、紫组
成,如罗伊·G.毕夫(Roy G.Biv)所言,而是由无穷的不可数的色彩构
成]。辐射曲线的纵轴也有很多问题。发热物体的能量同样是可测量但
是不可数的。想数出大小,普朗克不得不将光滑的辐射曲线近似为类似
于墨西哥金字塔一样的阶梯状。如果他让这些阶梯足够小,使这些阶梯小到难以感知到,这些锯齿形轮廓就可以被替换成光滑曲线。
尽管普朗克和同时代的一些科学家一样不相信原子的存在,但是他
想象力丰富。他知道一个炽热物体的热能是一些不可见运动的某种表现
形式。我们所感知到的热,事实是物体内部物质的不可见摇晃或者振荡
(你可以利用摩擦手掌或者用电钻钻一个硬物将运动转换成热)。基于
这种理解,普朗克提出了一个天才的模型,在该模型中,频率和能量都
是可数的。
最简单的储能以及以确定频率振荡的设备是谐振子(这个迷人
的“谐”字源于产生乐音的振荡)。一个谐振子或者简写成“振子”的例子
是:一个重物系在弹簧上,放在无摩擦的表面上,弹簧另一端固定在墙
上(见图1.3)。
其他例子如音叉、音乐设备和钟摆。当弹簧松开的时候,振子既无
动能也无储存在张开或压缩的弹簧中的势能。但是,当施加一些推力之
后,它的能量将从动能慢慢转换成势能。反过来,这个过程的频率是固
定的,大小用f 表示。如果没有摩擦,它的总能量是一个常数,优雅的
振动将一直持续下去。图1.3
作为权宜之计,拼接一些数学技巧,普朗克把炽热物体(如一个装
有正在燃烧的气体的小球)的总热能想象成物体内部分布着大量的没有
特定结构的微小振动,这些振动的功能仅仅是通过固定频率振动来储存
能量,以及一直以相同频率释放或者吸收光。它们并不是用来模拟其他
数不尽的气体性质,如化学成分、密度和电阻等。普朗克的模型难以捉
摸,但是却富有远见。
随后事实越发清晰,即普朗克想象的小玩意儿确实是真的。这些谐
振子就是组成发光球中振动的原子和分子,且事实上它们也释放和吸收
光(虚构的模型中这个坚硬的墙代表的是大质量的气体分子,使原子差
不多保持在其附近振动)。毫无疑问的是,原子的数量是巨大的,但是
依旧可数且具有确定的数目(尽管在实际操作中数出它们的个数并不现
实)。另外,正如他所言,普朗克谐振子“是单纯形式上的假设,并没
有赋予它太多的意义”。类似于掷骰子从2到12这11个分立的数字,普朗
克这个想象力上的大飞跃意义在于将一个范围内连续分布的频率分解成
一系列分立、可数的频率。
接下来,普朗克将纵轴,即辐射能量或者亮度分解成离散的阶梯,对应于骰子的每个值出现的次数。最后他做了一个闻所未闻的奇怪假
设,即每个谐振子只能储存少量且等额的原子能量,即普朗克所言
的“能量单元”。这是比仅仅分解纵轴更具意义的假设。对于每个谐振
子,他将其分为能量包,并认为能量包可能有不同大小,且依赖于频
率。假如能量包的能量为e ,那么谐振子能储存的总能量为0、e 、2e 、3e ,等等。这个序列不会趋向于无穷,因为炙热的球的能量只有那么
多,谐振子储存的能量最多是球的总能量,不可能更多。这个微妙之处
最终使计算变得不一样。这使计算很优雅且有限,而不是趋向于无穷。
为了预测实际实验的辐射曲线,普朗克必须弄明白e 的值。一个想
象中的能量包的能量有多大?由已知的知识,当振幅不变时,能量和频率成正比,普朗克假设单个包的能量和谐振子的频率(由f 表征)成正
比(振荡越快,能量越大)。数学上看来,就是基本的能量包等于一个
可调整的常数h 乘以频率(这个可调整的常数被称为参数,可以微调以
与环境相匹配)。公式表达即为:
e=hf
想象中充斥着储存在超大谐振子集合中的天文数字般的能量包,普
朗克依旧能够计算出总能量在谐振子中分布方式的个数,并且画出气体
球能量与频率的分布曲线。如同在掷骰子实验中一样,曲线的左端和右
端最终比中间部分要低很多。通过改变h 的数量级以及调整它的大小,普朗克以令人震惊的准确度重现了实验测量的辐射曲线。
尽管这个成就使他获得了诺贝尔奖,但是他长久以来希望他的能量
包只不过是计算上的应急之举,而一个新的改良的模型能够修复未破缺
的连续性。他不能简单地忽略常数h 或者让它消失,因为这个常数出现
在了实验室测量的真实辐射曲线对应的最终表达式中,但是他希望这些
小的谐振子和它们的微能量包仅仅是一个工具——就像将发光的网格线
投影到纸上,这只是用来辅助绘画,最终还是要把它关掉。
但是普朗克在计算谐振子和能量包上都犯了错。谐振子,如我之前
提到的,是原子和分子。能量包,则被称为量子(quanta ,量子的复
数,拉丁文中意为“数量”)。现在被命名为普朗克常数的参数h ,已经
是量子力学领域最基本的组成单元。普朗克绝望之下的小技巧最终被证
实是现代物理学诞生的开山之举。
在爱因斯坦那里,普朗克的小小的公式e=hf 变成了量子力学的象
征,就像E=mc
2 是相对论的象征一样。这两个方程中,后者的名声更
大,但是e=hf 却更加强大。相对论中能量和质量的关系是从更基本的相
对性原理推出的,与之不同的是,普朗克关于能量和频率之间的理论在
早期量子力学中则是一个没有解释的公理。现在,它被认为是量子力学的结果,而量子力学则依赖于更基本的原理。
在标准单位制下,h 的现代值
[4]
为:
h=0.000000000000000000000000000000000662606957焦耳秒
毫无疑问,科学计数法下表示为h ≈6.63×10-34 焦耳秒更方便,但是
写出代表许多个10的34个0的全部排列更直观地告诉我们在感官上无法
触及原子的世界。我们视觉上能够触及的范围,从100千米或者说是
1.0×105 米,到一个小头发丝的宽度1微米,或者说是1.0×10-5 米。超出
了这10的11个因子范围的尺度,我们需要用望远镜和显微镜形式的机械
性帮助。但是即使这样的机械性帮助仍旧无法抵达普朗克计算所需要的
难以想象的极小尺度。量子王国是通过理性思辨,而不是直接由感官,甚至都不是由我们的测量仪器去揭秘的。
普朗克如此不喜欢他的能量包,以至于他错过了他那小小公式的巨
大意义。它的内在意义留给了爱因斯坦。仅5年后,他推动了量子从便
利的数学虚构物向可测量的实在转变。爱因斯坦着手研究的是,能量是
否如同光一样在传播中保持分立性的特点。作为一个巴伐利亚诞生的
人,他曾经把这个问题用通俗的话表达出来:“尽管啤酒是一品脱一品
脱
[5]
地卖,但这并不意味着它是由不可分的品脱单位组成
[6]。”普朗
克认为物质内部有类似的单元组分,爱因斯坦则表示光本身就是由许多
能量包组成的,而这个组成成分被称为量子,随后被命名为光子。
古希腊的原子论哲学家曾经宣称,物质是由不可分的粒子组成的。
电子和携带电的不可切割的粒子,在19世纪末被发现。经过仔细考虑,爱因斯坦宣称,如同物质和电一样,光子也可能是粒子状的。
[1] 本书图表由莉莉·冯·贝耶尔(LiLi Von Bacyer)所绘
[2] Helge Kragh,“Max Planck:The Reluctant Revolutionary”,Physics World,December 1,2000,31-
35,http:www.math.lsa.umich,edu~krasnymath156-article-planck.pdf.[3] 频率的单位是每秒周期的个数,也被称为赫兹(hertz),简写为Hz。
[4] 由于频率的单位是周期个数每秒或者秒的逆,h乘以f之后就可以将秒消掉,最终量子e
的单位就是能量:焦耳。
[5] 1品脱=12夸脱(英)=1.365升。
[6] Phillip Frank,Einstein—His Life and Times(New York:Alfred A.Knopf,1947),71.第2节 光的粒子
我们不知道爱因斯坦是如何提出他激进而又影响深远的想法的,但
是他留下了许多线索。当被问到“思考是什么”的时候,他回答道,思考
并不起始于文字或者方程,而是“尽情想象”,这个过程或许会被我们称
为白日梦或神游,抑或是让自己头脑中的图像彼此交叠,如同万花筒中
的彩色玻璃碎片一样。即使这样,爱因斯坦继续说道,这也不是思考。
但是,如果在这个好玩的图像中,一些模式重复地蹦出来,这也许意味
着一个新的观念。进一步说,如果最终能够将这个观念表述成文字或者
是数学符号——找到了!——一个新的思想诞生了。
在1905年这个奇迹之年,爱因斯坦不仅用狭义相对论震惊了他的同
行,他也在探寻(Ponder)着光电效应的秘密(见图1.4)。当一束光照
射在某种特定的金属盘表面,它会将电子敲打出金属,将其释放出来。
既然电子是带负电的,它们飞离金属板将使金属板带正电。当仔细研究
这个效应的时候,它展现出两个让人感到疑惑的地方。如同期待的那
样,电子以假设的不同能量冒出来,然后在金属块附近跳跃着,速度减
慢并以无规律的方式跑出去。但是对于给定的单色光,似乎存在着最大
的电子能量——所有电子无法超越的能量极限。当提升光的强度,让金
属板完全被光照覆盖,使电子喷涌而出时,这样仍然不能提高电子的最
大速度或最高能量。是什么在抑制它们呢?
另一个疑点在于当不同的金属——当然也有不同的光——互相比较
时,光电效应会突然出现。对于每一种金属都存在着一个临界频率,低
于这个频率的时候,光电效应不会出现。换言之,当光的频率太低,即
光的颜色“太红”的时候,没有电子会被释放出来,不论照射光的强度是
多少。可为什么彩虹的红色一端的光无法将电子从金属中驱逐出去呢?图1.4
这两个观察到的现象——电子的最大能量和最小频率——在经典物
理中没法讲清楚。19世纪初光就被证实是一种波。随后,物理学家尝试
着用空间中以光速传播的快速振荡的电磁场去描述。想象一下,电子如
海滩上的鹅卵石,光则像海浪一样拍打在上面,将它们击出,散落在周
围。也许这就是爱因斯坦开始尝试构思的时候脑中浮现的画面,但是这
并不意味着对光电效应的详尽描述的合理性。在一定条件下,电子的速
度有上限。受到原子论成功的鼓舞,可以想象入射光事实上是由分立的
一团团的某种物体构成。这些物体不是原子也不是分子,因为我们知道
光子并不是由物质构成的。但是这个假设的单色光团的能量都是一样
的,并且一个团迎面去撞击一块鹅卵石,这块鹅卵石将会吸收这个团的
全部能量且不会更多(撞球球员知道,如果一个转动的球迎面撞上静止
的球,将会把自己的全部能量转给目标,并且不会更多)。在这一图景
中,如同观测到的一样,电子的能量将会存在一个最大值。
这时,爱因斯坦也许想起了5年前普朗克那有些别扭的论证,这也
使他不太情愿地采用物质以e =hf 能量包去释放光子的这个假设。尽管
爱因斯坦考虑的光电效应和普朗克考虑的发光物体的辐射曲线是不相干
的现象,但是它们有着内在相关性,即都与光的本质相关。只有爱因斯
坦发散思路所构建的那些图景才暗示着这两类实验,即一个是吸收光,另一个是释放光,也许揭示着一些共同模式。他最重要的一步就是将已经获得极大成功的关于物质和电的原子假设扩展到光,称它为团,或者
束,或者是一个量子,而现在这个光“原子”被称为光子,并且这是电子
之后被发现的第二个真正的基本粒子。这也为其他即将发现的基本粒子
树立了一个榜样,最近的一个例子就是希格斯粒子(Higgs particle)。
希格斯粒子被搜寻了半个世纪,最终在2012年被发现。
爱因斯坦将沙滩上鹅卵石被波浪击出的图景换成光源源不断地击打
陷在金属盘上的满满的近乎静止的电子上。偶尔地,一个光子撞击在电
子上,放弃它的能量e ,就像雪花融化在你的掌心这个过程一样。然后
电子匆忙地试图离开,在原子附近上下跳动,最终离开了它的监狱。它
以e 的能量逃离,在离开过程中会损失一定的能量,而问题就在这里,电子不会获得比e 更高的能量。增加入射光的强度能够增加被吸收的光
子数目,然而每个光子携带着相同的能量e ,对于每个受到影响的电子
来说,吸收的最大能量依旧不变,增加的仅仅是数量。这解开了第一个
谜。
第二个问题的解一定让爱因斯坦在第一次想到它的时候就振奋不
已。为什么存在一个“最红”的最小频率,即在这个频率下光电效应不会
发生?答案是金属携带正电的核子的吸引作用使电子被束缚在金属板
中,就像井里的青蛙一样,它们不能逃离金属板,除非光子给它们一个
推动作用。如果推动作用不够大,它们就只能待在板里。如果颜色太
红,入射光的光子能量将太低,而按照普朗克公式,每个光子的能量将
太微弱而无法提供所需的推力。每个金属都有个天然存在的最低频率,在这个频率之下,不论入射光多么明亮,也不会把电子击出金属板。
爱因斯坦关于光电效应的模型基于光子击打近似静止的电子这一图
景。关于这个模型的证明花费了将近10年的实验工作,不过最终获得的
结果是令人信服的:光是由粒子组成的。
相比而言,光是由波组成的实验性论证同样有说服力,也更简单。
这个观点第一次被验证是在1803年由托马斯·杨(Thomas Young,1773—1829)实现的,大约在普朗克和爱因斯坦的量子假设的一个世纪之
前。
使波明确区别于粒子的独一无二的特征在于,在特定的条件下,波
可以互相抵消,使什么都不剩下,这个技巧被称为破坏性干涉
(destructive interference )。而常识告诉我们,不论是白球、弹珠抑或
是其他常规粒子都不可能做到这种抵消。假设两个完全相同的波从不同
方向到达同一个点,相遇的时候它们会重叠,这种重叠被称为叠加
(superposition )(见图1.5),意味着在相同位置它们相加在一起,就
像重叠的摄影照片。如果两列波保持在这个点,恰好以完美的步调错
开,一列波的波峰恰好抵达另一列波的波谷,这两波相互抵消。这个因
为波发生破坏性干涉的暗点,如果你知道在哪看的话,就会发现这在自
然界很常见。海浪、声波、无线电波甚至是次声波或两个小孩舞动的跳
绳上的波,都能产生这个静止的点[如果这两列波同步,波峰遇到波
峰,波谷遇到波谷,则会彼此加强,这被称为有益干涉(constructive
interference )]。
图1.5
激光本身就是量子力学的产物,它的发现使观察光的破坏性干涉变
得简单。网上有许多关于“双缝干涉实验”自制的演示实验(见图1.6)。
其中有一个是将绝缘胶带粘在细线上做成双缝的形状,放在激光发射器
前面。用激光去照射双缝,在墙上会产生干涉图样
[1]。这两束光通过双缝之后,将会非常完美地同步。然而,对于墙上的每个点,光的来源
不同。既然从不同缝到这个点的距离有微小的不同(除了中间那条
线),光波的同步或者异步依赖于墙上的点的位置。你将看到的是墙上
的平行图案,要么是暗的,要么是亮的。
图1.6
简单说下这里为什么用缝,而不是用很小的开口(如小孔)作为光
源。为了使干涉更明显,这个小孔必须很小且足够靠近。在这个限制
下,小孔将无法使足够的光通过。但是如果适应细小的双缝,只要愿
意,你可以设计成你想要的任意长度,你将获得更多的光以及更好的成
像图样,即使这两个光源很小而且靠得很近。因此,这个实验通常是使
用缝隙而不是小孔去演示。
屏幕上亮线部分坐落在从双缝出来的光互相加强的部分,而暗线则
是相消部分,这也就证明了光是由波组成的(见图1.7)。
事实上,一旦你知道光是由波组成的,你可以在很多地方发现干涉
效应。举例而言,干涉使肥皂泡出现闪烁的颜色。肥皂泡的壁是由一层
薄薄的水层组成,当光线照射在肥皂泡壁上时,会在两个表面产生反
射。图1.7
内层反射的光束在通过水抵达外表面的时候会有延迟,穿出之后会
与外表面反射的光在步调上产生差异,步调错位的程度与水的厚度及光
的频率或者颜色有关。当两束光合在一起到达我们眼睛的时候,步调不
一致的将会彼此相消并从光谱中删去,恰好步调一致的会彼此加强。因
此,不同厚度的肥皂泡壁会喜爱不同的光,当泡泡扭曲、摇晃和畸变
时,这些颜色将会产生变化。自然以其内在极其艳丽的方式揭示了光的
波动性,几乎就像它向我们展示海面的波动性那样明显。
其他展示干涉的例子也很多。斜着去看CD光盘时,反射的光会产
生彩虹的颜色,蝴蝶的绚烂颜色,海贝中珍珠母的可爱光泽,雨中在柏
油马路上流淌的油泛着的微光,甚至孔雀尾的花样,这些都是自然界告
诉我们光是波的方式。但是它不情愿告诉我们,光也会表现得像弹丸倾
泻一样。一个模糊不清的现象(即光电效应)和爱因斯坦无与伦比的想
象力才揭示出这个奇妙的、被称为光的东西所隐藏的另一面。
因此,我们该怎么去看待光,它是空间中迅速传播的电磁波,还是
幽灵般的粒子束?[1] “Do it Yourself Double Slit Experiment(Young’s)—Easy At-HomeScience”,YouTube
video,http:www.youtube.comwatch?v=kKdaRJ3vAmA.第3节 波粒二象性
光子是奇怪的野兽。如果你打算重复双缝实验,并保留到达的光子
图像(就像用纸作为目标去保留由来复枪制造的弹洞),你可以注视着
图像的发展过程,并且同时观测双缝每一半的光的特性,即波和粒子的
双重属性。让光的亮度变弱,使其平均每分钟只释放一个光子。刚开
始,屏幕是黑的。然后一个点在某个地方出现了——“砰”的一声,一个
很小的孔出现了,意味着有一个光子到达了屏幕。“砰砰”声之间的间隔
是随机的:砰—停一下—砰砰砰—长暂停—砰砰—短暂停—砰砰—砰砰
砰砰,如此周而复始。在很长一段时间内,这些点看上去是随机散布在
屏幕上。但是,当成百上千的光子击打在屏幕上时,你会开始看到一个
图样:很有规律的间隔、条纹状图案平行于双缝(见图1.8)。如果你
等候足够长的时间,等到成千上万的光子落在屏幕上时,一个很明显的
双缝干涉特征条纹的图样就产生了。
图1.8
分立的粒子产生了这些点,尽管这些条纹为光是波这一论点提供了
无可辩驳的证据。或许你会饶有兴趣地耸肩,指出水波是由无数的H2O
分子组成的,那么为什么说到光具有类波和粒子性的时候会如此大惊小
怪呢?微妙之处在于时序。水波(像球迷在足球场玩起人浪一样)是由无数个单元组成,而每个单元和其他相邻的单元之间通过某种方式彼此
连接,所以才表现得整齐一致。但是从激光器射出的光子到达屏幕间隔
了很长时间,不可能存在某种联系和交流机会让它们去调整自己的位
置。它们可以在抵达间隔数小时而不是几分钟,而图样仍旧一样。这个
过程就像上万盲人和聋子观众在不彼此接触的情况下玩人浪。这就像魔
术一样,让人感到不可思议。
如果20世纪早期的物理学家对光子的波粒二象性感到不可思议,很
快他们会更加震惊。从1923年开始,他们逐渐意识到波可以表现得像粒
子一样,反过来也是成立的:电子一直以来被认为是粒子,同样能表现
得像波一样。这个令人震惊的结论,以极高的精度在类似于双缝的试验
中得到了证明。激光被替换成电子流,束流强度可以像激光一样调整,并且这个双缝要远比自制的光的双缝干涉实验要小且距离更近。替换空
白的墙或者摄影胶片的是一个荧光屏幕,这个屏幕会在电子撞击的时候
闪光。可实验结果几乎一模一样:点以随机时间间隔出现并且位置飘忽
不定,但是最终慢慢地变成了一个完美的平行干涉条纹(请在第五节阅
读更多相关内容)。
历史总是十分巧合和讽刺,波粒二象性也巧妙地体现在英国的一对
父子物理学家身上,这两个人帮助奠定了现在所知的量子理论的基础。
在1906年,J.J.汤姆森(J.J.Thomson,1856—1940),当时的物理实验
大师之一,通过使用电场记录电子类似于高尔夫球在地球引力场中路径
一样的抛物线轨迹,证明了电子是一种粒子,并因此获得了诺贝尔奖。
31年之后,他的儿子G.P.汤姆森(G.P.Thomson,1892—1975),跟随
他父亲的脚步,通过展示电子的破坏性干涉从而证明了电子是波,因此
也获得了诺贝尔奖。
这对父子中的父亲,也是位优雅的作家。他总结了这个困
境:“(物理中波粒二象性这个观点)就像老虎和鲨鱼之间的争斗一
样:每一个在自己的领域都拥有至高无上的霸权,但是在对方的领地却是无能的。”想象一下,光子或者电子作为一种粒子而言,都无法解释
双缝干涉。当把它们当作一种波时,则无法解释光电效应。波的理论和
粒子的理论似乎无法兼容。
J.J.汤姆森话中提到的这两个理论,如同鲨鱼和老虎一样从根本上
就是不同的,对应着光子和电子在不同的环境中的状态。这种解释并不
能使急切寻找真理的我们得到满足。物理学的目标不仅仅是讲述关于我
们这个物质宇宙中每个物体和事件令人信服的故事,更是去制造一个单
独的史诗般的作品,一个描述我们所在自然界的一致性的理论。没有谁
比爱因斯坦对寻找统一理论更有激情,而且他在鲨鱼和老虎之间的激烈
竞争中已经独领风骚。早在1909年,即提出光量子之后4年,量子力学
诞生前6年,他在德国物理学家的一次会议上在报告中预测:“我相信,在下一个理论物理发展的时期,将会有一个新的关于光的理论,这个理
论是波和粒子理论的融合。”他很明确地知道需要什么,即使他并不完
全满意所得到的解答。
波粒二象性的麻烦也是显而易见的。波和粒子是我们从日常的、宏
观的牛顿世界中获得的不同分类,这对于原子领域是不够的。光子并不
像海波或者子弹,电子也不是。它们和日常的波和粒子在一些特点上具
有共同之处,可并不是每一个特征都是一样的。那么它们该是怎样的
呢?我们无法如《爱丽丝梦游仙境》中的爱丽丝那样将自己缩小到原子
的尺度,然后自己去看基本粒子在其所处的环境中的行为是怎样的。我
们所能做的,就是用我们的想象力帮助我们去画出一幅与人类尺度的实
验室中所观察到的现象一致的图像。
为了调和不相容的波和粒子的类别,“波粒”(wavicle )这个术语曾
被建议来描述电子,但不幸的是,这个丑陋而且非正式的词从来都没有
流行起来。我的朋友罗尔夫·温特(Rolf Winter)受J.J.汤姆森用动物做
类比的鼓舞,更加生动地把电子比作鸭嘴兽。18世纪时,当探险者第一
次把鸭嘴兽从澳大利亚带到欧洲时,大学里知识渊博的博物学家宣称这种动物是伪造的,只不过是把其他动物的身体拼凑在一起。“爬行类动
物不会哺乳。”“同时是哺乳类和爬行类的动物是不存在的,因此它不过
是一个恶作剧。”他们信誓旦旦地说道。然而,他们所创造的分类是通
过自身有限的观察所得到的,这最终被证明是不足以描述地球生物的丰
富多样。同样地,光子和电子是可以表现为波的粒子以及可以表现为粒
子的波。就像鸭嘴兽一样,他们忽略了这个分类是从不恰当的前例得到
的。
为了继续向前发展,而不是停留在发明无用的诸如“波粒”这样的新
词以及将它和外来的生物做比较,则需要更激进的方法。1909年,爱因
斯坦倡议波和粒子的理论融合并没有得到响应,直到1925年量子力学诞
生。然而,量子力学在它诞生之前很久就已经冲击着物理世界。
1913年,丹麦物理学家尼尔斯·玻尔(Niels Bohr,1885—1962)构
建了第一个成功的原子内部模型。遵照物理学家从简单开始的习惯,玻
尔将他的注意力集中在氢上,氢是元素周期表上第一个也是最轻的元
素。他大胆地将氢原子系统类比成太阳系,并把氢原子描述成一个孤独
的电子如同地球绕太阳那样围绕中心核子转动,且只在特定分立的轨
道,即半径是固定的若干普朗克常量h 的数倍。当电子向上(或向下)
跳跃一个级别时,相应地会有光子被吸收(或释放),而光子的能量由
普朗克—爱因斯坦方程e =hf 给定。这个图像很快被逐步改善成包含了
椭圆形和圆形轨道,也遵循相对论,并可以用来描述比氢原子更加复杂
的原子。最终,著名的原子“玻尔模型”成为科学中最常见的漫画,即那
幅无处不在的一个点在中间、三个椭圆形代表三个电子轨迹的图片(见
图1.9)。据推测,那幅图描述的是元素周期表中的第三个元素——
锂。图1.9
这个小图标产生了无数的变体,已经被广泛地认为代表着原子,而
且被改编用于高科技公司、政府机构以及消费品的标志。它在情景喜剧
《生活大爆炸》(The Big Bang Theory )不同场景的荧幕上飞快闪过,并且在全球范围内,它意味着力量。因为这个标志所传达的信息如此简
单且令人信服,在高中教学中也占据着优势。对大部分普通人来说,它
代表着他们对原子结构的理解。
不幸的是,本质上它是错误的。
1919年,刚刚引入这个理论6年之后,玻尔被迫否认了这个理论,因为它歪曲了之前盛传的对原子内部电子行为的理解。玻尔模型将氢原
子内部单电子的轨迹描述为绕核子(已知为质子)的轨道,最终得到的
氢原子结构就如同煎饼一样平。但是我们知道的是,在观察它与其他原
子相互作用的时候,从外部来看,它就像是一个模糊的棉花球而不是煎
饼,至少在常态、静态的时候是这样的。
更糟糕的是,这个原子图暗示着电子在远离核子的地方保持在特定轨道上一直运动,这个轨道半径被称为玻尔半径(Bohr Radius )。但
是实验显示,当探测原子的时候,电子不仅仅在原子表面被探测到,在
这个棉花球的内部也能探测到。
玻尔模型最过分且让人不可原谅的瑕疵远远大于技术上的缺陷。通
过假设急剧又确定的轨迹,这个模型忽略了波粒二象性,而更青睐于它
的粒子本性。玻尔模型也可以说是一种倒退,退回到了牛顿物理:其中
一个粒子具有精确且连续的轨迹,并且在轨迹每一点都具有定义明确的
位置和确定的速度。以行星轨道的方式描述原子中电子的行为,在一个
世纪前就已经从物理学词典中删除了。
玻尔模型能够让人在头脑中产生生动的图像,它占据了大众对科学
的想象,甚至到了一种令人担忧的程度。它是阻碍发展的一个历史遗
址,它暗示着原子物理学在100年间没有任何改变。没有其他的基础科
学会给人留下这种印象:宇宙学不是这样,它产生了一系列令人窒息的
发现,如宇宙加速膨胀和谜一样的暗物质(dark matter )以及暗能量
(dark energy );天文学也不是这样,它每天都会得到遥远彩色发光物
体的炫目图片;生物学也并非如此,我们对大脑的结构、人类基因的微
妙之处以及令人震惊的演化结果有日趋增长的理解。那个广泛存在的原
子图标是如此过时,就像用马或者马车的画像作为停车场的标志或者是
用莱特兄弟的卡通图作为到机场的指路牌一样。
尽管玻尔模型之前是量子力学发展中重要的一步,但是它却早早不
适用了。尽管波粒二象性会使原子真实的图像变得更复杂,但是我认为
应该尝试着把玻尔模型老图标更新成更符合21世纪的新图标。也许在
1925年诞生的量子力学百年诞辰庆祝之际,会有人对这个图标公开质
疑。第4节 波函数
物理学家的目标是解释非生命世界的运作方式。首先,哲学家按照
如下方式描述一个客观物体:划过夜空的行星、冰雪的形成、七弦琴的
声音。当关注不能被直接看到或者不那么容易测量的时候,物理学家创
造了机械模型替代对客观事物的直观描述。希腊原子论用看不到的粒子
穿过虚空描述连续物质,马克斯·普朗克看到了发热气球中数不尽的小
振子,而尼尔斯·玻尔在他思考氢原子的时候把它想象成微型的太阳
系。
最终,机械模型失败了。它们被适时地抛弃了,取而代之的是更加
抽象的数学模型。相比它们的先行者,数学模型如同斯巴达一般冷峻。
它们由一系列方程和公式组成,不含修饰、色彩、可见的细节——没有
机械模型那样丰富的外观(谁不为玩偶之家、模型船和模型火车着
迷),但是数学模型之所以缺少吸引力,只不过是为了补偿它的一般性
和预测能力。牛顿广泛适用的引力定律则是数个世纪以来对自然现象的
纯数学描述最具说服力的例子
[1]
,它阻止了一代代专业和业余的物理
学家的无效努力。他们曾试图将引力产生描述为由不可见粒子的机械推
动和一些宇宙的流体的旋涡而引起的。然而,那些无穷无尽的天体和地
球的信息都可以被压缩在8个符号之中,知道如何解读的人就能发掘其
中的信息。
到发展原子理论时,我们渐渐发现传统的分类是远远不够的。原子
外壳中电子的运行轨道和速度似乎是无法获得的,原子释放光波看上去
像粒子,电子表现得像波。原子物理颠覆了原来的观念。
一小部分有杰出创造才能的物理学家意识到没有哪个机械模型能够
令人信服地揭示波粒二象性,他们转而研究数学模型,最终引领了量子革命。他们志在用数学语言描述原子物理实验所展现出来的奇怪事实,而不是美丽如画般地描述潜在的现实。这是大胆的一步,他们的许多同
行很难理解。但是量子现象的数学模型却硕果累累。
重大飞跃在于将客体和它的描述分离开。“我们先不去看电子本
身。”量子力学的创造者提醒道。偶尔他们会详尽地说,而更多的时候
则是含蓄地表达出来。“甚至不要试图去想象一个设备表现得像电子,相反,让我们先去寻找一系列数学方程,这些方程可以预测实验室中电
子的行为。数学并不会在意事物是否看上去像波或是粒子还是鸭嘴
兽。”令他们喜悦的是,他们做到了。
做到这个技巧的方案是一个公式,波函数(wavefunction ,一开始
是短语wave function ,后来也用过连字符连接的wave-function ,最终标
称一个合成词wavefunction ,这模仿了原始的德语构造方式)。它的创
造者是埃尔温·薛定谔(Erwin Schr?dinger,1887—1961)。波函数不仅
揭示了特定量子系统的属性,也包含了在这个系统上进行特定实验时的
必要细节。因此,波函数不只是有一个,对于每个独特的实验室设定,都有一个特定的波函数。在大多数情况下,用图像表示的波函数一点都
不像波,只有它的名字还在提醒我们,量子系统共有的一个重要的性质
是叠加以及建设性或者破坏性干涉的可能性,即两列波占据同一个点,甚至可能彼此加强或者消除。
通常来说,波函数的数学形式相当复杂——远比方程式E =mc
2 或e
=hf 复杂得多。因此,在这里我不讨论任何实际系统波函数的例子。但
是这并不意味着我们不谈论它们,这就如同你在享受音乐的时候并不需
要真正理解音乐。
玻尔将氢原子类比成微缩的太阳系,比这更大胆的类比启发了波函
数的构建。对经典物理学家来说,原子物理最令人费解的问题是原子能
级的分立问题。不像地球卫星能够绕地球任意高度转动,且可以携带任意能量,束缚在原子中的电子只有确定的、分立的能量。这种限制来自
哪里?
连续性中出现(就像魔术意义上)分立值最好的例子就是音乐了。
自远古时代以来,音乐设备,如七弦琴、鼓、长笛等,就能产生独立的
基本音调,还有泛音。把波限制在一个有约束的空间,如固定长度的
弦、圆形的鼓面、笛子中空的内部,你或许以为它们只会产生噪声,然
而产生的却是纯音高。音高对应着带音符的声波的频率,而音乐则由组
合不同分立频率得到。问题在于,原子限制电子,笛子限制振动的空
气,除此之外两者没有任何相似之处,从这个角度来看,音乐设备中众
所周知的频率分立如何帮助我们解释原子中神秘的能级分立?
答案当然已包含在量子力学第一个尝试性的假设中,即由普朗克—
爱因斯坦方程e=hf 给出的能量和频率之间的基本联系。
受众所周知的音乐设备所产生的声波公式启发,通过e=hf ,量子力
学创造者所面临的挑战是寻找具有分立频率的波的数学表达式,而这个
表达式又和原子能级匹配。这个表达式也许不是用来描述原子本身,但
是能够预测原子能级的梯度。埃尔温·薛定谔成功找到了建立一个数学
方程的一般步骤,反过来,这个方程的解就是他著名的波函数。
量子理论可被认为是一门找波函数并从中得到可测量结果预测的科
学。随着时间推移,计算上繁杂的技巧也在与时俱进,一开始借助计算
尺,现在则利用计算机。用这种方式研究的系统,从单个粒子和原子慢
慢演变到大团材料,再到星体内部,甚至到了整个宇宙。到目前为止,量子力学成功地经受住了每一个实验测试。
第一个用量子力学方式去处理的系统不是原子,甚至都不是电子,而是开创量子力学的装置——谐振子。它的数学描述仅仅涉及它的质量
和不变的频率(使振子回复到它的平衡位置的振动强度可以由这两个量
得到,所以不需要专门把它的形式包含进去)。不出所料,量子力学的标志普朗克常量h 在这个计算过程中扮演着重要角色。它如同比例尺一
样在图片边缘显示出来,为照片设定了度量,就像米尺为考古学家新挖
开的地沟照片设置了刻度。
作为理论上的小白鼠,谐振子非常简单,这是它的优势,而它的劣
势在于,在20世纪并不存在足够小的、真实的、能用来展示量子力学效
应的质量——弹簧谐振子
[2]。最多这只能作为进行更复杂项目前的一
个热身活动,诸如对氢原子的描述,得到的结果和实验的测量结果一
致。尽管这样,即使是机械谐振子也可以揭示经典牛顿力学和量子力学
间非同寻常的差别。普朗克在绝望之际猜测谐振子能量为e=hf 倍数,这
被证实几乎是正确的,但是并不完全。令人惊讶的是,限定(allowed)
的能量梯度并非从最低能级开始,相反,最低能级是一个能量量子的一
半,限定的能量是它的奇数倍e 2,3e 2,5e 2……普朗克非常幸运,因为不同能级间的差仍然是e 的倍数,这个差决定了一个特定的谐振子
所能吸收或者释放的能量,而这才是他真正需要假设的地方。一个量子
谐振子不能辐射或吸收46.7hf 能量,就如同杂货铺老板收到或者找零的
现金不能是46.7美分。这是无法做到的!如果你试图吸干一个谐振子的
所有能量,使它停下来,那么你注定会失败。就像一个极度活跃的咿呀
学语的小孩,你永远无法让他停止手舞足蹈。记住,在剥夺谐振子的所
有能量之后,由于h 是如此之小,因此剩余的震颤很难被检测到。尽管
如此,实验仍证实了量子力学的这个特殊的预测。
除了能量的量子化,波函数意味着叠加。根据经典物理学理论,物
体的位置和速度是被精确定义的。与此相反,谐振子或任何物质的粒子
的波函数所包含的位置和速度的值,可以在一定范围内同时以不同的值
分布,即叠加。注意,我并没有说位置和速度可以有分布。正确的表述
应该是:包含在波函数中的位置和速度可以有分布。这是很重要的一个
区别,随后我将更详细地讨论这个。
波函数有点像地图——最理想的地图,它包含了量子系统所有可以说的东西。在这里需要提醒的是,普通地图所包含的信息并不一定会被
完全展示在一张纸的图画或者地球仪上。举个例子说,道路地图册往往
包含了表单,其中列出了城市之间的距离以及驾车时间。为了简化问
题,设想一下,表单中的距离不是沿着高速路的真实里程,而是两个地
点之间的直线距离,就像鸟飞行的路线。想象一下,这个表的扩展版本
包含美国数以千计小镇的数据。原则上来说,通过这个表单是可以重建
整个传统地图的。下面是如何去重建:圣路易斯(St.Louis)在地图页
中间,纽约在右手边的边缘处,查阅电子表单中两地的距离。现在你就
知道了比例:在你的地图上,一英寸代表多少英里。然后,从表单中,找到这两个城市到迈阿密的距离并把它转换成英寸。既然三角形三边能
够确定一个三角形,现在你就知道了迈阿密的位置。继续这样的步骤,就可以得到整个地图了(见图1.10)。天文学家用这种方法记录地图,即把数以百万计的恒星的坐标列在一个很大的目录中而不是标在图标或
球体上。地图、表单和目录可被用于记录同一个数据集,尽管它们看上
去是如此不同,可对很多目的来说,它们是等价的。同样地,波函数所
包含的信息可以用公式、表单、一系列数字或者一张图去展示。
图1.10第一个关于谐振子的量子力学描述,事实上是用表单表达的,它在
数学上被称为矩阵(matrix )。这些矩阵随后很快被证明在数学上和波
函数等价。既然后者比前者更容易去想象,在本书大多数情况下,我将
使用波函数。
当试图解决量子力学的疑难之时,人们常常忘记了物体和它表示之
间的差别,这是大部分人甚至是一些专业的物理学家都会掉入的陷阱。
哲学家阿尔弗雷德·柯日布斯基(Alfred Korzybski)明确地表达了两者
之间的显著区别,他创造了一个格言“地图非疆域”(The map is not
territory.)。这个短语很精练地提醒了一个事实,那就是:一个对客体
的描述并不是客体本身。现实并不是和描述现实的模型一样,就
像“house ”这个单词不是砖和泥灰做的房子。柯日布斯基警示了把地图
和疆域混为一体的恶作剧,他的言辞引起了对量子力学的奇怪之处的一
些质疑,质疑在于这种奇怪之处并不是自然本身而是来源于波函数。是
否只是地图怪异而非疆域诡异?
当我们是小孩的时候,我们学着通过探索街道地图和它所代表的沥
青混凝土的关系,以此学着去读地图。当我们查阅静态的二维图像并试
图把它转换成我们周围庞大混乱的三维世界时,或者相反,当我们看周
围复杂现实世界的简单示意性的草图时,我们脑中闪过什么?比较疆域
和地图的这个过程是如此艰难,以致一些人从没能真正理解。如果再把
运动包含进去,如车载GPS(全球定位系统)屏幕,会让一些人更加疑
惑。类似的隔阂阻碍了人们对量子力学的理解。在量子的世界,薛定谔
的波函数就如同一个理论家笔记本中所构建的演化地图。假如它像地
图,那么它到底要描述什么?又如何将它联系到现实的原子世界?
[1] F=GmMr
2 ,其中F表示引力的强度,G是引力常数,m和M指相互吸引的两个物体的质
量,r是两者之间的距离。
[2] 一个和人的头发丝宽度大小的微小的音叉被《科学》杂志评选为“2010年度科学重大突
破”,它能够展现出量子行为。可参考http:en.wikipedia.orgwikiQuantum_machine。第5节 “最优美的物理学实验”
我们通常用波函数来描述量子系统中包含的信息。量子谐振子的波
函数预示了该系统只能储存离散的能量,这与我们熟悉的经典系统不
同,例如,一个音叉的能量是任意的,这与敲击它的力度有关。同样,氢原子的波函数暗示着它的能量也是分散的,只不过能级图比谐振子更
加复杂
[1]。
对于量子系统,波函数不但包含能级的信息,也预言了其他不计其
数的实验结果。给定任意实验装置和相关说明,原则上用量子力学精美
的数学语言可以构造出该系统的波函数,并且计算出相应的测量或观测
结果。这里我将避开这些技术问题,而是通过讨论电子的波粒二象性进
而解释波函数的意义。让我们拭目以待,看看波函数是如何处理这个谜
题的。
下面我们将比较物理学家是如何描述子弹和电子这两个不同的抛射
物的。
我们先讨论子弹。为了简单起见,忽略重力和空气阻力的影响。一
旦子弹离开枪管将不再受任何力,根据牛顿运动定律,它将一直保持直
线匀速运动,直到碰到靶子——我们暂且假设靶子是一块木头
[2]。子
弹突然受到制动力,同样根据运动定律,它会减速直至停止。停止之
后,由于各个方向子弹都承受同样的挤压,因此它不再受力,保持静
止。
射手和他的装备将决定射击的精准度。据说,传奇的神枪手安妮·
欧克丽(Annie Oakley)能够精准击中抛向空中的硬币。而如今,如果
利用那些精心制作但价格离谱的装备,包括激光、透镜组和计算机等,一些业余的选手都可以轻松击败她。在经典物理学中,枪法的精准度没
有任何限制。设想如果在开枪时子弹的速度和位置是限定在特定范围内
的,那么它最终撞击的点也会有相应的限制。原则上我们可以无限精准
地射击,虽然这并不现实。所以,理论上如果安妮拥有足够好的枪,足
够敏锐的视力,并且手完全保持静止,那么她就可以击中硬币上任意一
点。
下面我们来说说电子。电子通常是从一个被称为电子枪的设备中发
射出来。过去在美国家庭中这种“武器”比猎枪更为常见。那些老式的电
视机中都有电子枪,它们藏在电子成像管的末端,而现在家庭中常用的
平板电视则不再包含这样的设备。这里我们考虑电子从电子枪发射出
来,然后终止在屏幕上并且留下可见点,和刚才一样,忽略电子在中间
运动过程中受的力。
量子物理学家不能像对待子弹一样追踪电子的轨迹,而只能计算它
的波函数。为了得到波函数,他需要知道电子枪的几何形状以及电子离
开枪口时的速度。和谐振子与原子中的电子不同,该波函数的示意图实
际上与电子枪到屏幕之间的波类似。像石头在水中激起的涟漪一样,波
函数从枪口向屏幕扩散开来。而当电子碰到屏幕时,奇迹出现了。之前
如水波一样的波函数突然莫名其妙地塌陷到屏幕的某个点上。在碰撞之
前,它还在空间中向四面八方散开。而碰撞之后,波函数在空间各处的
大小则几乎为零,除了它最终到达的那个点。
这种现象我们称之为波函数塌缩,它告诉我们波函数的意义,却如
此离奇。我们会在下一节中讨论这一解释的缺点。
我们不断地发射电子枪,最终会在屏幕上绘出一个图案。这个图案
由每次碰撞的点组成,它是理解波函数意义的重要线索。每次碰撞的点
在图案中是随机分布的。这里随机可理解为不可预测的、没有规律的。
而随机这个词则体现了之前提到的经典力学和量子力学之间最关键的差
别。当然,安妮·欧克丽或许并不觉得太惊讶。如果考虑到空气的影
响,枪的某些不确定的特性,甚至她自身脉搏的跳动,那么她击中硬币
上的点的位置也将是随机分布的。她或许会想:“我不可能比这更精准
了。”然而,经典物理学家则坚持认为,假如给定各种因素的细节,子
弹的路径是可以预测的,并且可以达到任何想要的精度。在经典物理
中,这只是统计的随机性,往往源于我们对某些微小的细节的忽略或者
无知。我称之为安妮·欧克丽随机性。原则上经典力学并没有随机性。
例如,硬币抛掷,其结果通常被认为是完全随机的,但是利用力学,每
次的结果也是可以被预测的。安妮·欧克丽随机性是可以通过适当的方
式消除的,虽然不能完全根除,但是可以无限接近你想要的精度。
与之截然不同,电子的随机性则是不可避免的。即使我们把电子枪
的尺寸和电子的速度都控制在足够的精度范围内,波函数传播仍有不可
避免的随机性。在创立量子力学的早期,物理学家很难接受这种量子随
机性。其中爱因斯坦一直没有接受这种观念,因为这与他辉煌且硕果累
累的一生中所理解的物理完全不同。他察觉到其中的矛盾。虽然他对量
子力学做出了非常重要的贡献,而且量子力学以惊人的速度获得了成
功,但是他相信自己敏锐的物理直觉并不会欺骗他,因此他毫不忌讳地
表达出自己对这个刚出生的量子理论的怀疑。他机智地提出各种异议,有些在他逝世多年之后才被证明是错的。爱因斯坦错了,量子随机性确
实存在,但是一批爱因斯坦最忠诚的拥护者仍希望最终可以证明他是正
确的。
量子随机性(也被称为本质的或者固有的随机性)撼动了自亚里士
多德以来的物理学的一块基石——因果律。任何一种现象或者事物都必
然有其原因。虽然我们很难确定相应的起因,但通常假设它必然存在。
如果安妮·欧克丽总是射中硬币上的字母L 而不是Y ,可以想象,经过足
够多的努力我们肯定能够得到其中的原因。另外,电子由于遵循量子法
则,则否定了这种可能性。对于一个像爱因斯坦那样的经典物理学家来
说,抛弃因果律就等同于破坏了整个物理学。后面我们会讨论量子贝叶斯如何将物理学置于一个新的、更有弹性的基础之上,并使之能与固有
的随机性自洽。
电子枪绘出的图案为理解波函数的意义指明了方向。如果碰撞的点
是完全无法预测的,那么这些不规则的点会覆盖整个屏幕,对电子的路
径我们便一无所知。但是我们确实对此知道一些——事实上知道很多。
波函数精准描绘出圆形的、对称的形状,而且点集中在中心,并且点的
密度随着离中心的距离越大而递减。因此,电子枪给我们提供了一个随
机却内含部分信息的例子(见图1.10)。
科学现象往往遵循着类似的规则。通常一些现象很少能完全展示出
所包含的信息或者完全不包含任何信息。例如,误差总是和测量形影相
随。即使在生活中,绝对的确定性或者完全的随机性也很少出现,天气
预报或者交通模式就是最好的例子。这两个例子的共同特点就是我们可
以给出很多预测却不能百分之百的准确。数学中的概率便是用来处理类
似情况的。概率这个概念在量子力学中与普朗克常数h 同等重要。但是
引入这个概念的结果则是十分微妙的。图1.11
电子枪绘出的图案暗示着波函数并不是用来描述电子本身而是反映
概率的。尤其是电子即将碰撞屏幕时的波函数决定了电子最终到达屏幕
上任意点的概率。
通过概率来解释波函数是量子力学带给物理学的重大改变
[3]。
在第3节我们讨论了光的双缝干涉实验,实验结果向我们展示了随
机和规则是如何交融在一起的。两个分离的源发射出的光波干涉之后形
成条纹状的图案,而每个光子则被记录为那些随机分散在照片底板上的
点。
1965年我刚刚开始教物理,同年,理查德·费曼(Richard
Feynman)出版了他著名的教科书《费曼物理学讲义》。在书中他详细
阐述了电子双缝干涉的理想实验进而讨论量子力学。设想左边是一个电
子枪,中间是两个极小的双缝,而右边放置着荧光屏,当电子击中荧光屏时会产生一个斑点。2002年,该实验被一个英国的杂志《物理世界》
评为“最优美的物理学实验”。
在费曼的书出版之前,物理学家就已经做过该实验的简化版。但是
直到2013年,技术上才足够成熟,费曼在半个世纪之前描述过的实验才
能真正付诸实践。除了创造和探测单个电子的困难之外,另一个让人却
步的现实阻碍就是双缝的尺度。用现在的说法,这些缝是纳米(nm)
量级的(1nm=10-9 m=十亿分之一米=百万分之一毫米),这么一个精密
的工程是不可能在家中通过电线和绝缘胶带完成的。看到那些随机出现
的点逐渐绘出条纹状的图案,我们犹如正在看量子力学是如何工作的,这一定是一种让人着迷的体验
[4]。
除了演示波粒二象性和量子随机性,这个实验也毫无疑问地展示了
波函数的传播。每一个细缝仅有60纳米左右的宽度。这个数字说明我们
可以忽略电子在发射点横向的具体位置,而屏幕上显示的条纹的宽度大
概有300毫米。为了让波函数的两部分发生干涉,必须把双缝到屏幕之
间的宽度增加5000倍。这显然说明了波函数扩散得非常开。
仔细思考这个实验,我们很容易误入歧途!思考一束光从激光发射
器到双缝,向前传播、干涉,最终产生条纹图案。当我们把光换成电子
之后,似乎就变得不那么自然。这是因为我们知道电子只能一个接一个
地通过双缝。更进一步,如果考虑在2013年那个实验中将双缝板和屏幕
移开,将电子枪指向窗户,那么电子将会像蹒跚学步的小鸭子一样排成
一排向前传播,但是在传播大约2000千米之后,它们就会分离开来。每
一个电子都独立传播。双缝只是将波函数而不是电子本身分成两个可干
涉的部分。而对于每个电子来说,在没有其他电子干扰的情况下,却莫
名其妙地设法避免碰撞到那些条纹的暗区,就像有一股神秘的力量在操
纵它一样。
做双缝干涉的那个实验组基于他们的测量仪器、相关误差等仔细地计算了电子的波函数。实际的运算要比费曼书中考虑的理想化计算要复
杂、冗长。测量成千上万个电子在屏幕上的位置之后,他们将结果与量
子力学的预言比较。屏幕上展示的正是前面我们说到的条纹图案而不是
随机的点。实验组最后简洁地评论道:“我们看到的结果正是量子力学
所预言的。”他们艰辛的努力是值得的。
[1] 马克斯·普朗克得到的谐振子的能级稍微有点差别,与之不同,尼尔斯·玻尔用他自己的
力学模型得到的氢原子能级是完全正确的,大约12年之后才有波函数的概念。
[2] F=ma,其中m是物体的质量,a是它的加速度,F是引起物体加速的净外力的大小。
[3] 数学上描述波通常包括正值和负值,分别代表波的高度在x轴的上方或者下方。但是概
率却不能为负值:它们是0和1之间的实数。更糟糕的是波函数通常包含虚数,如-1的根号。因
此波函数的数值不能等价于概率。正确的数学描述是这样的:“概率密度等于波函数和它的复数
共轭相乘。”我会简化为一些惯用语,例如,“波函数得出概率”。
[4] 关于这个实验可参考《费曼双缝干涉实验取得重大突破》(“Feynman’s Double-Slit
Experiment Gets a Make over”)这篇文章,Physicsworld.com,March 14,2013,其中还有相关的视
频,参考网址:http:physicsworld.comcwsarticlenews2013mar14feynmans-double-slit-
experiment-gets-a-makeover。第6节 见证奇迹的时刻
如果见证单独的电子逐渐在屏幕上绘出条纹图案是一段让你不安的
经历,那么将其解释为波函数塌缩会让你更加困惑。为了帮助理解,我
们仍将电子枪类比于一杆真正的枪。子弹从枪膛发射出之后以不变的速
度运动,最终击中目标并且停下来。同样地,电子的波函数也根据量子
力学的规则向前传播,最终突然改变它的特性转变为屏幕上的一个斑
点。虽然这两种情况有相似的地方,但是它们的不同之处也是显著的,只是现在还不能明显看出来。
子弹在任意时刻都是严格遵循牛顿运动定律的。
而电子则表现得有些反叛。在电子碰撞到屏幕之前,它的波函数随
时间演化,像平静湖面上的涟漪一样扩散。它的演化由量子力学的运动
定律决定。相应地,在某特定点找到电子的概率也在空间中迅速扩展
开。但是,当电子在屏幕上停止的时候,描述它的波函数也会立刻、彻
底地改变它的特性。波函数塌缩了,同时概率也转变为(几乎完全)确
定的信息——电子的位置。塌缩的过程没有任何规则、规律。它确实发
生了。波函数塌缩的原因及方式自从90年前量子力学诞生开始就一直是
物理学家争论的话题。
量子力学的创造者在试图解决波粒二象性的谜题时,被迫采取折中
的方式。通过引入波函数,同时将它与概率联系到一起,他们成功地把
波动行为和粒子行为统一起来,但是他们不得不为此付出代价。他们必
须要放弃一个从牛顿到爱因斯坦一直根植于经典物理中的信念,即任何
物质的粒子都遵循同样的运动定律。事实证明,一个电子的波函数并不
服从子弹所遵循的运动定律。相反,波函数遵守下面两个不同的定律:(1)只要电子离开电子枪并且没有被观察到,那么它的波函数将
是光滑的、连续的,且是可以被预测的。它就像飞行中的子弹或者湖面
上的涟漪一样遵循着特定的数学方程演化。
(2)当电子在屏幕上留下斑点时,这就暴露了它的行踪,那么波
函数将立刻“塌缩”到一个新的、集中在碰撞点附近更紧凑的形式。
图1.12
无与伦比的科学漫画家西德尼·哈里斯(Sidney Harris)
[1]
在他的
卡通画“奇迹”中恰巧准确地描述了类似的情况。我倾向于想象着图中两
个物理学家正在讨论量子力学。波函数的塌缩不仅是空间上“塌陷”到有限区域,而且更一般地指可
能性到确定性的转化。不仅是位置,就连能量、速度、运动方向以及其
他量子粒子的属性都是概率性的,而且随着波函数的传播而变化,直到
我们做了测量之后,相应的量才会固定在特定的值。你要知道,在经典
物理中这些物理量是确定且唯一的。量子力学中可以找到很多例子并不
是这样。例如,电线中描述电流的波函数可以在向前的同时也向后流;
一个分子可以同时有不同的几何结构;放射性粒子可以同时地衰变和稳
定。我们或许会问,在这些可能的状态中,它们到底处在什么状态?实
际上,只有我们问了并且知道了这个问题的答案之后,它们才真正处在
某个特定的状态。
科学中并不应当存在奇迹。然而,偶尔有奇迹试图渗透到科学思维
中,真的就那么奇怪吗?毕竟世界呈现给我们如此之多的未解之谜。只
是聪明的人们并不称之为奇迹。牛顿的万有引力定律就是一个极好的例
子。
设想你手中拿着一个苹果,然后松开手,苹果就会落向地面。为什
么会如此?它留在原处不动不是更自然吗?如果你是一个飘浮在外太空
的宇航员,那么苹果确实会如此——悬浮在你面前。但是在地球上,它
却会下落。
牛顿解释道,这是由于地球在施加一种神秘的力,他称之为引力,这种力会吸引苹果并且将它不可逆转地拽向地面。这些看不到的触手是
什么?它们是真实的还是我们想象的?它们由什么组成?我们又能否操
控它,使它中断?如何阐明它们的本质?
通过推广他的定律,牛顿化解了这些谜题,他声称包括苹果、地球
等在内的所有实物之间都会相互施加吸引力。正是这些力使月球保持在
它的轨道,使地球围绕着太阳转动,使你我不至于飘到外太空。这被称
之为万有引力,它是超距作用最好的例子。但是超距作用是完全不合理的。生活常识告诉我们,直接的接触才
产生力。想要移动一个椅子,你必须要接触它,不管是直接用你的手,还是间接用棍子或者绳子。棒球在接触到球棒时才会改变运动方向,声
音和热的传播也是通过分子振动附近的分子,然后将运动形式链式传递
下去。光子携带着光或者无线电波从发射源到接收器。微观上看,即使
像前面提到的推动椅子产生的接触力,最终都可以解释为电磁相互作
用,通过点对其附近的点的扰动传播。而超距作用却与这种普遍存在的
现象不一致。这只是给奇迹披上了“自然定律”的外衣。
假如超距作用存在,考虑下你自己对宇宙的影响吧。根据牛顿的理
论,当你向前移动一步时,宇宙间任何的粒子,地球上的任何人,每一
个行星和恒星,不管它们离你多远,都会瞬时感受到引力的变化。仿佛
不需要传递任何信息,你身体的变化都会瞬时影响遥远物体。
当然,牛顿也意识到自己的定律也不像是真的。在万有引力定律已
经被尊称为伟大的自然定律之后,牛顿收到了一封质疑超距作用的信,在回信中他写道:“那些没有生命的物质,不通过一些非物质的中介,可能对另外一些没有接触的物质产生影响。这让人难以置信……引力应
该是物质固有的、内在的属性,是其不可缺少的一部分,所以一个物体
可以(通过)真空作用于远处的另一个物体,而且中间不通过那些可以
使力或作用相互传达的媒介。这对我来说是如此荒谬(重点强调),我
相信任何一个有哲学思考能力的人都不会赞成这样的观点。因此引力必
然是通过遵循特定定律的中介的持续作用引起的,但是关于这些中介是
物质的还是非物质的问题,我就留给读者思考了
[2]。”
牛顿将他对物理学最伟大的贡献称之为荒谬的言论!1666年左右,24岁的牛顿发现了它。他生命的那段时间被认为是他的奇迹之年,这并
不是因为超距作用是一个奇迹,而是因为那一年,牛顿的创造力达到了
顶峰。同年,他还发明了微积分,也成功地将太阳光分解为彩虹的颜
色。提出万有引力25年之后,牛顿非但没有因为不合理性而放弃超距作
用,反而一直在为它的有效性辩护,但他也承认它是十分费解的。他已
经计算出了引力作用的定律,但是仍不明白其物理意义。作为一个虔诚
的信徒,他私下将引力的作用归因于上帝,但是却明智地将这个问题留
给他的读者让他们自己下结论。他以简洁的数学公式描述了奇迹,却无
法解释它。
然而,从1666年到1916年,万有引力定律权威统治了两个半世纪,直到爱因斯坦发现了引力的本质。诚然,中间这些年出现了无数种用复
杂的力学模型来解释引力的尝试,却没有一个在实验或者数学上站得住
脚的。250年间,物理学家以牛顿的万有引力定律为基础做出了很多奇
妙的预言,范围遍及海洋潮汐、地球扁平的形状,甚至日食以及彗星出
现时间。这么一个“荒谬”的定律却取得了巨大的成功,以致其他与引力
无关的物理现象也模仿了它的数学结构,如电磁力。
爱因斯坦反对超距作用,不仅仅因为它与我们的常识违背,更重要
的是和狭义相对论矛盾。1905年是爱因斯坦的奇迹之年,他提出任何物
体、信号、信息的速度都不能超过光速。超距作用却以无穷大的速度穿
越空间,根据狭义相对论这是不可能的。因此爱因斯坦自己发展了一套
引力理论,我们称之为广义相对论。广义相对论展示了空间如何以自身
为媒介通过邻近的相互作用将引力传送到远方。和超距作用相反,这被
称之为定域作用,因为空间中某点只会影响它附近的点,而不是远处的
点。这样一来,如果你向前移动一步,你附近的空间会稍微弯曲一点,通过邻近点的作用,这点扰动向外以光速传播,到达世界某个遥远的地
方,穿过太阳系,穿越银河,传向宇宙的深处。250年之后,万有引力
中的那些奇迹最终被更复杂但也更明确的理论取代了。
牛顿那些值得尊重的旧理论成为这个新理论在某些极限条件下的近
似。虽然它仍是一个非常有用的近似,却已经不具有基础意义。这类似
于,虽然物理学家知道固体、液体、气体都是由原子组成,但仍以连续的物质近似地处理它们。
波函数塌缩也是一种超距作用,因为这也包含着在某一瞬间任意大
的空间区域的突然变化,它和牛顿引力一样让人费解。但是犹如牛顿的
引力一样,波函数塌缩也证实了它的价值,这也让它成为科学正统。绝
大多数的物理学家都将量子力学视为已被证实的事实,例如,叠加原
理、概率解释、波函数塌缩等。他们在计算和观测中获得了成功,并说
服自己:“自然就是如此运作的!”只有个别人会认真考虑这个哲学的谜
题,并试图解决它们,这类人现在也在慢慢增多。这些勇士最核心的目
标就是明确量子定律的第二步,也就是波函数塌缩。它涉及从概率性到
确定性这一令人费解的跳跃。
[1] 图1.12由西德尼·哈里斯绘,“我想你应该在第二步中更显稳重”,版权归Sidney Harris,sciencecar-toonsplus.com所有。
[2] 艾萨克·牛顿给理查德·宾利的信,给宾利的信,16923,与宾利的第三封信,1693年2月
25日,引于理查德·宾利工作,The works of Richard
Bentley,ed.A.Dyce,vol.3(London,1838;repr.,New York:AMS Press,1966),212–213。第7节 量子不确定性
和爱因斯坦的质能方程E=mc
2 以及薛定谔的猫一样,沃纳·海森堡
(Werner Heisenberg)提出的不确定性原理已经成为大众文化的一部
分。不管是汽车贴“海森堡可能睡在这里”,还是电视剧《绝命毒师》
(Breaking Bad )中的现代版“化身博士”沃特·怀特的别名“海森堡”,海
森堡的名字已经代表着量子物理对昔日的确定性的否决。但是将他提出
的原理解释为“任何事物都是不确定的”是人们经常犯的一个肤浅的错
误。比这个错误更严重的是海森堡自己的一个过失。不确定性原理有时
候也被称为海森堡原理,可以看作是从波函数严格、完美推导出来的数
学定理。它表明一个粒子的位置和速度不可能同时完全地确定下来:位
置越精确,速度就越不确定,反之亦然。其他的变量对如能量和时间也
遵循类似的规则。但是海森堡对这个数学定理的解释却是有瑕疵的。
海森堡给出的定理并不是精确的。虽然它在精确地计算中并没有
用,但是它可以作为一个非常有用的经验法则。在原子系统中,在通过
完整的理论给出最终的结果之前,该定理可以很快给出大致的估计。例
如,不确定性原理可以解释为什么量子谐振子的能谱中会有一个最低非
零的能量。假设,相反最低能量是零,所以你就可以确定谐振子的速度
和偏离位置都是零——谐振子没有振动,弹簧也是松弛的。但是这就违
背了不确定性原理,所以上述情况一定是错误的。如果谐振子遵循量子
力学,那么它就必须轻微振动,这样位置和速度也就在变化,因此在一
定范围内是不确定的。基于不确定原理,甚至可以不严格地证明量子谐
振子的最低能量不是零而是e=hf 2。然而在通过认真计算波函数得到相
应的结果之前,你并不能相信这些估计。
经典物理中那些子弹、高尔夫球都有确定的位置、速度及运动方向,不确定性原理与这些明显是矛盾的,海森堡试图给出隐藏在数学表
达式后面的物理本质。这并不是他擅长的,与现实、偏直觉的亚里士多
德般的论证相比,他更喜欢那些抽象、偏数学化的柏拉图式思考。虽然
如此,他还继续从实践的角度用通俗的语言阐明了不确定性原理,他的
解释似乎使包括我在内的好几代物理学家都深深信服。不过现在我们相
信,虽然不确定性原理本身是正确的,但是他的论证则是有误导性的。
海森堡认为量子不确定性起源于测量对被观测的物体的影响。他提
出了一个巧妙的理想实验,被称为海森堡显微镜。考虑一个运动的电
子,为了完全确定它的位置,你必须抓到它,碰到它,或者让它反射
光,至少要用一个光子与它相互作用才能得到它的位置信息。这个与它
碰撞的光子反过来也会使电子的位置或者速度改变。因此当这个被反弹
的光子帮助我们探测到电子位置的同时,观测的另一个结果就是改变了
电子的速度。更细致地研究这个理想实验,海森堡最终可以给不确定性
原理一个貌似合理的物理解释。
他所涉及的应该被称之为观测者效应,这种现象很容易理解,也是
实际存在的。即使不在量子力学中你也可以找到测量对被观测的物体产
生影响的例子。化学家早就知道在灌满热水的罐子里插入一个室温温度
计会使热水的温度降低。律师也都清楚他们问问题的方式会影响最终的
答案。人类学家也小心翼翼地使他们的研究对象尽量不受研究本身的影
响。最坏的情况是一次测量甚至完全破坏了被观察的物体,例如,验尸
可以确定死因,但是尸体本身也已经被破坏掉。
在海森堡提出不确定性原理之后的90年间,物理学家才慢慢意识到
它既不依赖于物理测量的反作用也不取决于测量仪器的精密度。事实上
它有更深层的原因,它是由物质的波的本质决定的,我们经常用波函数
来描述这一本质。经典的波也会显示出固定的持续时间和能量的倒数关
系。设想海面波动后形成一串涟漪。如果这串波只是有几个周期,每个
周期都有波峰和波谷,你可以通过测量时间来确定它的频率。整个涟漪的长度和持续时间很长。另外,如果这串涟漪只有一个孤峰,它的长度
和持续时间可能比较短,但是你不能定义它的频率,因为这至少需要一
个完整的周期。而你最多只能把这个孤立波当作很多不同频率的波叠加
后的结果,这些波恰好在孤立波的最高点附近达到它们的波峰。经典波
的规则意味着波持续的时间越长,它传播的频率就越低,反之亦然。
不仅是水波,声波也满足类似的持续时间与频率的倒数关系,我们
在听一场交响音乐会时就能感受。单簧管持续很久的A调有一个单独
的、明确的音高或者频率。相反,钹碰撞时间通常只有几分之一秒,却
没有可辨识的音高。事实上,印刷版的简谱上对打击乐器是用特殊的记
号而不涉及音高,这是因为碰撞产生的音高是没法定义的,而持续时间
则可清楚表示。
对于一个不稳定的粒子来说,普朗克—爱因斯坦方程e=hf 使经典波
的持续时间与频率的倒数关系转变为粒子寿命与能量之间的不确定性关
系。需要再次强调的是,和推导波函数时一样,普朗克常数仍是连接经
典与量子的纽带。
双缝干涉实验是说明不确定性关系最好的例证。它展现的是电子波
长和路径信息之间的不确定性,这里的路径信息指的是电子到底通过了
哪一个缝。波长可以很容易地从仪器的尺寸和干涉的图案得到
[1]
,而
路径信息却很难得到,除非利用极端的方法。如果你把其中一个缝遮
住,你知道电子只能从另一个缝通过。但是当你这样做时,干涉条纹以
及由它产生的波长的证据就消失了(当然它会消失,毕竟,它是由两列
波干涉而形成的)。对电子路径信息的测量是如此具有极端破坏性,以
至于这种方式完全禁止了另外一条路径。因此这里的不确定性也是极端
的,我们能确定的要么是波长,要么是路径,却不能同时将两者定下。
正当物理学家越发深入地理解不确定性原理时,新的技术使他们找
到新的方式来操作单个粒子,正像前面提到的费曼实验一样,以前的许多理想实验也有望在实验室中变为现实。双缝干涉实验中的不确定性分
析正是如此,他们可以同时得到波长和路径信息,而不是像以往一样只
能在极端的情况下实验。还远不只如此,21世纪初这类实验新版本也明
确地证实了海森堡是错误的:量子不确定性并不是观测者效应。
这个实验的独特创新点是使对路径的观测机制分开足够的距离,以
确保观测不会直接干扰到观测粒子——他们实验中用的是光子
[2]。光
子一旦通过双缝,便会被立刻送入一个特殊的晶体,该晶体可以使光子
自发产生两个等同的(或者互补的)新光子。它们两个各有用途,并沿
着相反方向传播:一个被称为信号,它将贡献屏幕上缓慢形成的干涉条
纹,另一个起到目击者的作用。每一个信号光子都有其对应的目击者。
目击光子在原来的光子通过双缝之后到达它最终的目的地,这也解
释了为什么该实验被称为延迟选择实验。通过不同的标准方式安置的光
学“魔法”镜,能够确定原来的光子到底是通过了哪个缝,或者完全不知
道从哪个缝过来的。
通过这样的布置,信号探测器通过广泛的扫描就可以探测到成千上
万的光子。这些被探测到的信号光子对应的就是旧式双缝干涉实验中屏
幕上的点,只不过这里每一个信号光子都有它相应的目击者。这样,实
验者就可以选择性地处理数据。第一种情况,从所有收集到的数据中,他只选出目击光子没有泄露路径信息的信号光子,并画出信号探测器的
位置(对应之前的屏幕上的点),他会发现期待中的条纹状图案。事实
上,这种情况相当于他重复了一遍1803年托马斯·杨做的实验。第二种
情况,他也可以选出那些目击光子透露路径信息的信号光子,这时就不
再会有条纹出现。但是这两种情况下,双缝都一直保持敞开。
实验结果所包含的信息是十分清楚的。作为目击者的探测器离得如
此远,以至于它不可能影响双缝附近发生的事情。和把其中一个缝堵住
不同,条纹的消失不是因为观测路径引起的力学效应。简而言之,不确定性原理不是观测引起的效应。
从海森堡的显微镜到将不确定性原理解释为波函数基本的、普遍的
历程,使人想起量子力学历史中其他类似的情况。普朗克建立的发光物
质的力学模型引出了波粒二象性,进而由波函数解决。一个纯粹数学上
的波函数加上相应的概率解释替代了玻尔力学的氢原子模型。两种情况
都显示一个力学的、容易想象的描述是不充分的,它们最终都会由抽象
的数学描述替代。
抽象是成熟的标志之一。儿童开始只是通过算账来学习关于钱的知
识,但是后来他们的理解扩展到一些抽象概念,例如,成本、价格、贷
款等。从社会角度来看,正义的概念从简单的、个人的“以牙还牙”的原
则发展到复杂的、抽象的法律系统。在物理中,成熟意味着摆脱切实的
力学模型转向数学的抽象概念(拉丁语中的抽象abstrahere ,意为使脱
离)。但是抽象万不应该与复杂混淆。一个概念可以抽象,但是它无须
复杂。
[1] 波长≈xdL,其中x是干涉条纹的距离,d是两个双缝的距离,L是双缝到屏幕之间的距
离。
[2] Bram Gaasbeek,“Demystifying the Delayed Choice Experiments”,July
22,2010,http:www.arxiv.orgabs1007.3977.第8节 最简单的波函数
对大多数人类活动来说,“从简单开始”是一个很好的忠告。即便在
科学中也是如此,尼尔斯·玻尔从最简单的氢原子开始研究而不是更复
杂的其他原子;量子力学也只是在最简单的谐振子上获取经验。因此,我们这里也从最简单的波函数开始。这个例子不涉及数学方程,而是以
栩栩如生的符号出现,并且它将展现出波函数四个基本的特性:叠加、概率、离散和塌缩。在后面我们探讨量子贝叶斯的含义时,这个例子依
然很有用。
即使最简单的原子也拥有错综复杂的结构,这里我们只考虑基本
的、不可分割的粒子。之前我们已经遇到过两个:光子和电子。光子不
能用简单的语言描述。在真空中它们总是以光速传播,而观测并不能使
它减速或者停止。当它们被探测到时,也就意味着它们消失了。波函数
和通常的量子力学已无法描述光子幽灵般的行为,物理学家必须用更复
杂的方式。而电子却如同弹珠一样,我们可以使它减速、停止,也可以
轻易地储存它、检测它,甚至操纵它。因此电子和我们的日常经验更接
近。另外,电子不仅是包括我们身体在内的各种物质的必要组成部分,而且作为能量(电线中)和信息(计算机中)的载体使我们的生命得以
维持。电子是我们探测微观世界再合适不过的工具了。我们一般用位
置、速度、质量或者重量以及电荷等来描述电子。另外还有两个其他相
关的特性,其中一个是它围绕自身的转动,称之为自旋,另一个是磁性
[1]。电子就像微小的磁棒或者缩小版的指南针一样,拥有稳定的、可
精确测量的磁场强度。量子力学准确地预言了这一强度,并且让人难以
置信的是精度高达十亿分之一(这大概是你拇指宽度与纽约到夏威夷距
离之比)。上面所列举的电子特性也适用于球形的、带电的塑料球。当这个球
围绕着自身的轴转动时也会像一个磁棒一样。因此我们倾向于把电子想
象为缩小版的地球。它比地球要简单得多,因为电子是完美的球形,此
外它的自旋轴和磁轴是重合的(和我们生活的地球不同,一个旋转带电
的塑料球的磁轴也是穿过它的两极的)。但是量子力学不只是微小物质
的经典力学,仔细研究电子会使我们逐渐发现新大陆。
你是否注意到之前我们列举的电子特性里面包括电子的质量却没有
提它的尺寸?电子到底有多大?或者说有多小?令人惊讶的是不管多么
精确、复杂、昂贵的实验都不曾测到过电子的尺寸。说的更确切些,一
旦理论学家给电子设定一个很小的半径,很多预言都会出现问题,包括
我们前面提到的高精度的电子磁场强度。最好的假设就是电子的半径是
零,这样理论预言才能和实验测到的结果一致。根据我们现在的知识,电子可以严格当作点粒子。当然也许未来有一天我们发现电子确实有下
层构造,相应的也有半径,但是迄今为止,这只是主观猜测。所以我们
就干脆把它想象成一个没有大小的粒子吧!
可是问题来了,一个点粒子怎么可以围绕自身的轴旋转呢?一个点
可以围绕着另外一个点转动,但是一个点围绕着自身转动就讲不通了。
自旋意味着物体不同的部分绕着穿过该物体的某个轴运动,但是一个
点,它根本就没有不同部分,不可能自旋。把电子当作旋转带电的球是
一个不可靠的力学模型。自旋这个词如同玻尔的氢原子模型一样,是很
有误导性的概念。不幸的是,我们只能被迫接受相互矛盾的结论:电子
有自旋和磁场,却没有体积大小。
在发现波粒二象性时,我们试图将宏观世界的概念强行应用到量子
的微观世界出现了很多问题,这里再次出现了同样的情况。我们不得不
用更丰富的想象力才能使自己内心得以平静。也许我们可以类比《爱丽
丝梦游仙境》中常露齿嬉笑的猫的遭遇。随着它的身体渐渐模糊并最终
消失,这只猫只留下了它的露齿笑。这促使爱丽丝察觉到她经常见到一个不露齿笑的猫,但是从来没遇到过露齿笑的猫。电子就像越来越远的
转动的球一样,越来越小直到最终消失,但是自旋仍在。
自旋还有更多的谜题。电子的自旋不像小球一样可以随意减速或者
加速。它有一个固定的大小,而且和无处不在的普朗克常数相关。
为了查明电子内在的指南针(相应的自旋轴)到底指向哪里,你可
以把它放到一个普通冰箱磁贴的北极附近。电子会排列好,并且它的磁
场的南极将指向磁贴的北极。你可以把电子翻转,使它指向相反的方
向,就像你用手指推指南针一样,但是你必须要消耗一定的能量才能做
到。
一个普通磁棒的磁场强度和方向是可以随意变动的,与之不同,电
子的磁场强度是固定的,方向也是受限的。尤其是测量电子的自旋(相
应的磁性)时,只有两个值可以出现。测量自旋的仪器都包含一个固定
的外磁场作为任意选择的参考方向。奇怪的是,电子的自旋总是沿着选
定的参考方向,或者与之相反。即使我们将它转向反方向,它也不会沿
着与外磁场垂直或者呈45°夹角的方向。电子的磁性(或者自旋)经常
用向上或者向下的箭头表示。当测量垂直方向的自旋时,它总是指向上
↑或者下↓,而不会出现与垂直方向有一定夹角的情况。同样的,如果参
考磁场的方向是水平沿着x 轴的,那么电子将只可能指向左边←或者右
边→。一个自旋球的自旋方向是任意的,而电子却只有两种。对自旋方
向的限制正像对谐振子或者原子能量的限制。这也让我们联想到一个长
笛的音高限制。
如同其他描述原子世界的变量一样,自旋也服从不确定性原理或信
息权衡。如果你准备一个自旋指向上的电子↑,然后测量水平x 轴方向的
自旋,那么结果是随机向左←或者向右→。相反,如果你知道电子自旋
是向右的→,沿垂直方向测量,那么最后结果向下↓或者向上↑也是随机
的。我们已经到达量子力学的核心地带。自旋遵循着特殊的规律,虽然
在被费曼称之为“量子力学之谜”的双缝干涉实验中并不起作用,但是它
仍是一个不可思议的事情。
实验中所涉及的电子的波函数通常包含两部分。“外部”波函数主要
涉及电子在空间的运动,例如,我们之前遇到过的在原子中的电子,或
者从电子枪到屏幕,通过双缝的电子都属于这一类。另外,电子还
有“内部”波函数,它只处理电子自旋。一般在计算中,这两部分波函数
总是交织在一起。但是我们可以将两部分区分开,忽略外部波函数,而
只关注内部波函数。这样我们就达到了我们本节开始提到的目的:最简
单的波函数。
外部波函数可以在三维空间中散布开,在空间任意点的值都对应着
在该点发现电子的概率。与之不同,自旋波函数并不生活在真实空间
中。自旋波函数的发明是量子力学早期历史中里程碑式的事件,它是纯
抽象的量子力学的构造物,与我们日常生活没有相似的地方。这意味着
每一个电子拥有“双重性格”,只有在它的磁场或者自旋方向被观测时,它才会展现真实的自己。否则,它的双重性格就会一直隐藏在另一维
度,和我们生活的空间没有什么联系。
我们往往无法看到量子力学所展现的神奇世界,并不是因为它们通
常很小,而是因为它们中的一部分我们只能通过想象而不能通过常识来
理解,电子自旋正是我们窥视这个神奇世界的锁孔。在众多爱因斯坦的
名言警句中,其中最鼓舞我们的一个是:“上帝难以捉摸,但并不心怀
恶意。
[2]”暂且不管上帝,这句话告诉我们,虽然自然的秘密总是隐藏
得很深,而且很难梳理清楚,但是最终都是可以用理性和想象力理解。
每当自然呈现给我们一个明显的悖论时,它总是同时亲切地悄声告知我
们解决它的线索。电子自旋就是它给予我们的线索:它让我们窥视到了
量子世界的种种秘密。自旋这个词很容易让我们联想到棒球或者溜冰者,在量子力学中是
不恰当的用词,自旋波函数的两个可观测的态也不是必须被标记为顺时
针或者逆时针。事实上,它们也可以被称为上下、左右、+-、是否、正面反面、开关或者黑白,但是为了与计算机编码联系到一起,它们
按照惯例被记为0和1。这两个数字就像页码一样只是方便的记号。
除了用于描述电子自旋或者磁场,自旋波函数在其他方面也大有用
武之地,它可以用来描述任何具有两个组态的量子系统。这样的例子有
很多,比如,分子两种不同的结构之间的转换,线圈中顺时针或者逆时
针的电流,原子中两能级系统,光子水平或垂直方向的极化,放射性的
原子核的状态,等等。最简单的波函数都能够恰当描述类似的系统。由
于自旋波函数十分简单,在大学开设的量子力学初级课程中,它逐渐取
代了费曼的双缝干涉波函数。
用表格的形式,电子自旋是用2×2的矩阵来描述的,这是最小的方
阵(一个1×1的矩阵不应该被称为矩阵,它只是一个数字,而且并不能
展示出量子叠加)。
和电子自旋相似的系统无所不在,因此它们获得了专有的名字。任
何只有两种可能态的量子系统被称为一个量子位(qubit,英文发音为
cubit)。英文单词qubit 是quantum bit (量子比特)的缩写,而bit (比
特)这个英文单词是binary digit (二进制码)的缩写。经典的比特
(bit)表示一个可以取值0或1的量,是从拨动开关开和关的状态抽象出
来的符号。而一个量子位是一个真实的量子力学的物体或者系统,它指
代具体的事物而非一个符号。
但是要注意的是,量子位这个词与本书的主题量子贝叶斯理论
(QBism )没有关系。有趣的是,英文单词qubit和QBism都有一个同音
异意词cubit(腕尺)和Cubism(立体主义),它们分别指古时候一种测
量长度的方式和20世纪初艺术的一个流派。不仅这两个同音异意词完全
没有关系,而且qubit和QBsim也是毫不相关。qubit和QBsim的第一个字母q 意义是一样的,都是指quantum (量子),但是qubit的小写字母b
指的是binary (二进制的),而QBsim的大写字母B 则指的是Thomas
Bayes(托马斯·贝叶斯),他是18世纪的一个牧师。有时候混乱的科学
术语会产生一些奇怪的组合。
一个量子位的数学表达方式被称为量子位波函数(qubit
wavefunction )。为了区分量子位和量子位波函数,本书中我将用斜体
的量子位来表示量子位波函数。这种字体是为了强调两者的区别,因为
在学术文献中柯日布斯基的警告经常被忽略
[3]。
对于特定的实验系统,通常可以用球面上的一个点来代表量子位。
球面上的任意点都对应着一个概率。不管实验测量的结果是什么,在球
面的两个极点分别被记为0和1,在这些极端点之间则表示这两个值的混
合或者叠加。例如,在球面赤道上的点对应的量子位表示结果为0的概
率为50%,就像抛硬币时正面向上的情况。在北半球的纬线代表着实验
结果是0的概率要大于1,在南半球则相反(见图1.13)。图1.13
和纬线不同,球面上点的经线并没有经典对应。这完全是量子力学
的变量,代表着相位,对应着想象的抽象空间的角度。球面上两个相邻
的量子位更倾向于干涉加强(两个波函数波峰遇波峰,波谷遇波谷),然而球体相互对立的两个点则干涉减弱(波峰遇波谷)。相位是效仿经
典波,它最显著的一个特性就是叠加,量子力学最初就是由此受到启
发,并在波函数中沿用了“波”字。
因此,这个量子位球面直观展现了叠加现象,以及相应的概率解
释。除了两个极点,球面其他地方的点并不能预言出单次测量的结果。
重复进行一模一样的实验将得到一串随机的0和1组成的数字。点所在的
纬度则预示着0和1在这一串数字中出现的概率。
比较特殊的是两个极点,它们不是叠加的状态,没有相位,这反映
了量子力学的不连续性。就像量子谐振子或者一个原子的能级是分立的、可数的,而非连续的,其他的很多测量结果的个数也都是可数的。
电子的自旋就是如此,量子位有两种可能的结果,极点代表确定的状
态。总之,这两个极点组成一个比特(bit)。
或许量子位最引人注目的信息并不是我们看到的球面。它并不是一
个电子的照片或者玻尔的氢原子模型。它存在于我们想象的三个维度
中,而非我们现实的世界。这个球面的点隐含着实验测量结果出现的概
率,但是当我们做出测量之后,系统将跳到0或者1。这种跳跃就是“臭
名昭著”的波函数塌缩。
球面上的点可能一直保持位置不变,也可以沿着某条规定的路径移
动。例如,设想在某时刻产生一个有辐射性的原子核,我们可以用量子
位的值来表示该原子核的状态。如果它已衰变分裂或者发射出某种辐
射,那么将之记为1,反之则记为0。最初球面上的点在北极点,对应着
0。随着时间的推移,该原子核已衰变的概率也在慢慢增加,所以对应
的球面上的点也将向下逐渐滑向南极点。不管怎样,只要我们不观测原
子核,球面上的点也绝不会到达南极点。如果你确实观测了原子核的状
态,那么你会发现它已衰变或者仍保持稳定。这时,量子位将塌缩到其
中一个极点。未观测前球面上点的路径是可以通过量子力学精确地预言
出来的,但是量子力学却无法解释瞬时跳跃回北极点或者向下跳到南极
点的情况。测量之后量子位将限定在一个比特的取值0或者1,但是测量
前它并不对应一个比特的取值。
量子位球的图像并没有解释叠加、概率、离散性或波函数塌缩,也
不能展示它所代表的数学方程,但是它能够栩栩如生地展示量子力学最
基本的要素。虽然它看起来和波没有丝毫关系,但我们仍称之为最简单
的波函数图像。
[1] 一般情况下一个物体的转动程度是由角动量衡量的,而角动量依赖于物体的质量、形状
和旋转速度。让人惊讶的是角动量的单位和普朗克常数h是一样的,这一巧合也启发了玻尔建立
旧的氢原子模型。[2] “Raff i niert ist der Herr Gott,aber boshaf t ist Er nicht”,Alice Calaprice,The Expanded
Quotable Einstein(Prince ton,NJ:Prince ton University Press,2000),241.
[3] 柯日布斯基为波兰裔美国学者,他发展了普通语义学。——译者注第二章 概率
第9节 概率的烦恼
量子力学的规则在构建波函数的时候如同水晶一般给出了清晰的指
示。有时,在解答的过程中也许会遇到数学和计算上的困难,但是物理
学家很少对做什么有疑问,只有如何做才会让他们抓耳挠腮。最终,在
一番辛勤劳作之后,他们得到了波函数,并准备将它应用在实验中。
理论和实验之间的联系最终被证明是概率:要么是波函数预测了各
种可能结果的概率,实验室则提供数据来检验它;要么反过来,实验上
测定的概率引导物理学家计算出相应的波函数,由此可能得到其他实验
的信息,并对那些实验做出预测。初看上去,概率是如此基本以至于直
观上看显得平淡无奇。几乎每一个足球队长都知道,在掷硬币的时候,出现正面的概率是多少?12或者50%。掷一对骰子时,摇到6点或者7点
概率哪个更大?我们计算下可能的方式。一共有6×6=36种可能的投掷方
式,但是只有少数几个方式产生6点和7点:(1,5),(5,1),(2,4),(4,2)和(3,3)与(1,6),(6,1),(2,5),(5,2),(3,4)和(4,3)。这两个概率分别为536≈13.9%和
636≈16.7%,因此得到7点的概率比6点的概率大约高3个百分点,掷骰
子赌博的赌徒也一定从经验中留意到了这一点。
简单来说,一个事件出现的概率等于想得到的结果的数目(举例而
言,出现6点)除以所有可能事件的数目(如之前提到的36)。即使事
件的数目不可数,这个公式也行之有效。例如,一个被蒙着眼的孩子向
海报上投掷针,假设针落到海报每个区域的概率是随机的,那么她扎到海报上的一头驴的概率是多少呢?只要把驴的面积除以整个海报的面积
就可以了。结果是分布在0和1之间的实数——一个合理的概率,以分数
或者百分比表示出来。
这样计算出来的概率是理论上的抽象数字。在复杂的情形下,它们
是如何相加或者组合在一起是纯数学分支中一个被称为概率论的学科研
究的问题。这个理论处理的概率并不比欧几里得几何中细线、无维的点
以及完美的圆更真实。概率论和欧几里得几何的抽象之处是否有现实中
的应用不是一个逻辑上的问题,而是关乎实验和观测——这是一个科学
问题。我们或许觉得抛硬币或者掷骰子是如此简单以致我们关于它们的
直觉无须验证,但是就像生活中的许多事一样,真理往往妙不可言。面
对惊喜最好还是提前做好准备!
考虑一个被称为方块工厂(cube factory )的悖论,它是由哲学家
巴斯·冯·弗拉森(Bas van Fraassen)基于一些古老问题中类似的困惑而
提出的(这个例子在量子贝叶斯框架下似乎特别恰当)。想象一个陶瓷
工厂,它生产出一大堆小的陶瓷立方体,它们边长随机分布在0到1厘
米。你随机捡起一块并且检测它,那么你所测量的立方体的边长介于0
到0.5厘米的概率是多少?一个非常诱人的答案是0.5,因为期望的结果
区间正好是所有可能的区间的一半。但是,等等!注意到,立方体的每
一面的面积都是在0到1cm2 。那么,在你手上它的一面测量的结果在0
到0.5cm×0.5cm或0.25cm2 的概率是多少?既然0.25是总的分布区间的
14,那么你的立方体落入这个区间的概率也应该是“14”。情况会变得
更糟糕。如果你测量的是立方体的体积而不是边长或者一个面的面积,体积的变化则从0到1cm3 ,然后问题就变成:你测得0到
0.5cm×0.5cm×0.5cm=0.125cm3 的概率是多少?答案是“18”。对于同一
个简单问题却存在三个不同的答案,这就是我们要说的悖论。那么哪一
个是正确的呢?
从数学上来讲,这个问题没有答案。在现实情况下,通过考虑实际生产过程,或许能挑出其中一个答案。在机器内部的某一部分一定存在
着一些随机的过程。是否有一个卡尺在随机地测量0到1厘米?如果是这
样,那么第一个答案是对的。或者是一个天平在称量黏土的重量?使相
应的体积在0到1立方厘米随机分布,而这团黏土随后会被塑造成一个完
美的立方体。在这种情况下,第三个答案是对的。或者说这个随机化也
可能以另外一种不同的方式发生,相应地也就产生了冯·弗拉森问题的
第四个答案。
方块工厂给我们强有力的提醒:概率是一种非常尖锐的数学工具,在现实应用它时,需要倍加小心。
不仅仅在逻辑和数学中,就连自然本身也会产生出惊奇的事情。考
虑两个球,被画成白色和黑色,分别被随机地存储在不同的壶中。只有
四种方案去分配它们:(白黑,0),(白,黑),(黑,白)和(0,白黑)。发现两个球在一个壶里面的概率显然是24或者12。这种决定
概率的方式是数个世纪以来标准的计算方法,而且看上去非常明显。在
划分两个候选人的选区或者计算出扑克牌的胜算时它也是非常有效的方
法,但是在量子世界中,它则被证实是错误的。
光子并不像壶里面的球。它们表现了量子力学的另外一种特性,这
种特性在现实中是不曾见到的:相同频率(相同颜色)的光子彼此是完
全不可区分的。新的硬币看上去彼此相似,但在微观尺度,它们高低不
平的表面很容易被区分。即使在我们当前技术能分辨的层次上硬币是一
模一样,不论它们去向何方,它们在穿越时空的时候总可以被追踪到并
且以此去区分它们。硬币可以根据它们的历史还有它们的样子去区
分,“这是美分A,另一个是美分B”通常是正确、可靠的说法。然而对
于光子来说,却无法那样去标记它们。一旦彼此靠近,它们将表现出波
的特征,叠加在一起,然后失去原来的特点。与硬币不同的是,它们在
根本上就是不可区分的。
以两种不同极化方式(相当于经典例子中的壶)分布,用两个星号代表光子,分配两个全同光子的可能方案是(,0),(,),(0,)。现在,发现两个光子在同一个极化态则由12上升到23。这
一变化看上去并不多,但是当我们在现实应用中重复数万亿次时,它从
根本上改变了光子的统计。印度物理学家萨特延德拉·纳特·玻色
(Satyendra Nath Bose)率先得到这种非同寻常的计数方式,通过研究
光子而非假设的谐振子,他成功地重新得到普朗克辐射定律。作为创造
光子这一概念的人,爱因斯坦也惊讶于这种计算并对它印象深刻。他确
保其他物理学家都知道了玻色的结果,之后他将玻色统计方式推广到有
质量粒子。80年后的2001年,诺贝尔物理学奖授予了由若干原子展示的
玻色—爱因斯坦统计的实验观测。
电子同样彼此不可区分,但是它们遵循第三种统计方式,与传统的
版本以及玻色的版本也不一样。电磁表现出与光子相反的特性。光子倾
向于彼此挤在一起,而电子则尽可能彼此分离。如果两个壶替代为原子
中的能态或者两个自旋相反方向,量子力学中一个被称为不相容原理
(exclusion principle )的规则禁止两个电子占据同一个状态。因此,态
(,0)和(0,)是严格被禁止的,只有(,)是被允许的。如
果这个规则被突然之间神奇地终止了,那么原子中所有的电子将落在最
低能态,化学品之间的区别将因此而消失,所有的物质将会塌缩。
计数方式的两个简单改变,修改了潜在的概率,接下来决定了粒子
的量子统计以及导致了物质和辐射行为的深远结果。事实上,这个结果
不仅仅深远——它们关乎存在。没有玻色—爱因斯坦凝聚或者不相容原
理,我们所熟知的世界将不复存在。
试图按照你对大理石的分类方法对基本粒子进行分类,同样会引起
不恰当的问题,而在之前我们就遇到的波粒二象性以及旋转点的概念,现在再次发生了。基本粒子并不按人类常识期待的那样表现。
当量子物理学家第一次引用概率时,像方块工厂或者粒子统计这些
理论和实验上的惊奇之处应当引起他们足够的注意,但是他们并没有注意。尽管这么去思考事情更加周密,但他们并没有这么做,部分原因在
于物理学家对哲学的猜疑,甚至接近于蔑视。事实上,概率不仅是生活
常见的、每天都会涉及的概念,甚至小孩子都会用到,而且也是多个世
纪以来学者争论不休的学科。在任何情况下,不论是什么原因,当理论
和实验最终相匹配的时候,量子物理学家降低了他们的防备,放弃了他
们批判性的才能,并且想都不想地附和长盛不衰的概率的定义——“期
望的样本除以所有的样本”。
因为它是基于计算事件出现的次数,在这种解释的情况下,概率的
含义被称为频率概率。从19世纪中期到20世纪上半叶,它已经被发展成
严格的数学定律,并且在学校中作为一种不证自明的真理去教导。它被
定义为数字的比例,并且在观测中也可以做到,频率概率呈现出一种客
观的样子。掷硬币中的50%概率展示了硬币真实且内在的属性,如同质
量和尺寸一样是可测量的属性。
但是即使最坚定的频率学家也并没有走得更远。他们宣称客观的特
征仅仅是从一系列掷硬币的过程中得到的,而不是来自一次对硬币的检
验或者一次投掷行为。他们对概率的定义被发掘出来都类似如此:“在
大量掷一个两面平衡的硬币时,正面的概率是50%,所以投掷出正面的
概率接近12。”但是数学家并不满足于模糊的字眼,如大概、大约、近
似于这些词。因此他们假设一个无穷次的掷硬币过程作为替代。相应
的,正面出现的概率达到了50%,因此概率是12。不幸的是,这种假设
同样失去了它的客观性——它是假设且实验上并未验证。
频率概率所面临的另外一个问题是公平(fair )这个词。有必要做
出如下假设:硬币是完美对称且每一次投掷的行为是完全一样的。事实
上,这是一桩美事。假如在每一次都非常仔细地完全一样地掷硬币,就
像假设的那样,至少在牛顿的经典决定性世界中,结果总会是一模一样
的。没有正面和反面的随机序列,那么掷硬币也不会遵从概率论。因此
实验处理的是关于硬币和掷硬币的有限信息——有限到允许一些变化但是还不足以阻止如定律般的统计规律的出现。
正经的数学概率学家面对这些担忧往往选择隔岸观火,并且只是假
设概率有些精确的数字(如假设的掷骰子中的16)并且把无限次执行
当作原始的公理,以此把现实世界中的应用留给了赌徒、民意调查专
家、医药统计学家以及物理学家。数学家对凌乱的现实应用避而远之。
明知道一个硬币不可能被掷无限次,数学家还是精确定义了它并使之成
为一个公理,然后证明他们关于完美的硬币、无偏的掷硬币以及无限耐
心的定理。但是物理学家没有这么奢侈。
概率的频率解释中最有成效的一个原理也是最有效地将数学和现实
世界经验分开的一个原理。它声明概率用于多次实验而对单个实验或者
事件只字未提。对频率论者来说,“单个事件”概率是毫无意义的,就如
同对一个单独的数字讲“差值”或者对一个孤立粒子谈“吸引”。
无法理解这一限制就会得到赌徒谬论(gambler’s fallacy ),这是
学校老师最担心被问到的问题。硬币已经出现正面100次之后,出现反
面的概率肯定高于50%,因为出现101次正面是极其不可能的事。特别
是,赌徒谬论暗示掷硬币、摇骰子、发牌、转轮盘已有的结果(大量的
结果可以定义概率)对下一次的结果毫无预测能力。这个规则被灌输进
学校孩子的脑中,并被当作广为接受的智慧。
频率概率对于物理学家在处理精细控制下的多次实验时是有帮助
的,但是它排除了概率与我日常所见的单个案例的概率的相关性。在频
率概率论的框架下,诸如“今天下午有30%的概率会下雨”“牛奶可能变坏
了”和“她也许喜欢我”,是毫无意义的。
这里有一个故事可以凸显出课本上的概率论和日常经验所用的概率
之间存在的巨大鸿沟。在朋友的陪伴下,你进入了一个礼堂,在台上,一个赌徒正在掷硬币并且邀请你加入。“我和你打赌一块钱,结果是正
面,”他说道,“正面的话你给我1元钱,反面的话我给你1元钱。就是这么简单!”相信赌徒谬论,并且想体验一把刺激,你觉得有必要试试运
气。但当你张嘴准备说话的时候,你的朋友在你耳边耳语说:“前100把
他扔出来的都是正面!”
那么问题来了:下一步你怎么做?请不要把这个故事变成一个枯燥
的教科书问题:硬币是否有偏差?你的朋友得到的消息是否有谬误?这
个赌徒会不会出千?仅仅让这些流于表面吧,考虑下什么会真实发生。
请竭力去把它想象成现实中的含混之处和不确定性。对我来说,答案非
常清晰:我将屈服于不足信的赌徒谬误,相信过去的事情会影响现在的
概率,拒绝频率概率论,并且相信我的直觉。即使连续出现100次正面
理论上是可能出现的,并且不会影响下一次的投掷结果,但是我仍然不
会打这么一个赌。
一个统计学家也许通过如下假设去定义他的理论:如果硬币确实是
公平的,而且投掷的行为确实是公正的,并且你的朋友和赌徒都是诚实
的,然后我就应该打这个赌。没有更多的证据,我就不愿意冒这个险,即使仅仅1元钱。那么你呢?
什么会说服我这个硬币是公平的?如果我或者我信任的人掷硬币
100次,并且看上去随机出现大约一半的正面,我将同意公道的人说它
事实上是公平的,至少对所有的现实目的都是如此。但是我用于得到这
个结论的论证似乎并不是如它所看上去那样直接。
数学物理学家马库斯·阿普尔比(Marcus Appleby)是量子贝叶斯理
论的早期支持者之一,他用一个生动的寓言故事阐述了这个观点
[1]。
如他所述,想象一下,爱丽丝(Alice)在欧洲转动一次有37个数字的轮
盘,得到数字11,并且得出结论:轮盘是公平的。她的论证肯定是存在
问题的,并且一个正常思考的人应该都不会轻易相信她。一次转动的结
果不可能暗示转盘的任何公平性。现在假设不一样的情况,鲍勃
(Bob)投掷100次硬币,获得了一个正面和反面的序列,在检查之后,发现是由50个正面和50个反面组成,看上去顺序也是随机的,因此得出
结论说硬币是公平的。(见图2.1)
如果鲍勃仅仅依赖这些观察到的现实而没有做其他事情,他所得到
的结论并不比爱丽丝的强。从数学概率论角度去看,100次掷硬币的序
列等价于一个2100 个扇区的巨大转盘,其中每个扇区由不同序列的100
个正面和反面的序列组成(如果它被设计为弹珠大小的球,那么这个庞
大的机器在我们可观测的宇宙这么大的体积内都装不下)。其中的一个
扇区正好精准地用的是鲍勃得到的序列标记。因此在转动这一巨大的轮
盘一次之后,他获得了结果,从这个结果出发,他得到了结论:其他序
列是可能的,并且轮盘、硬币都是公平的。尽管在规模上存在巨大鸿
沟,但是鲍勃的论证和爱丽丝的论证一样是错的。
阿普尔比创造这个故事是为了解释概率的频率概念令人不安的不一
致性。严格来说,对单个事件,概率的定义是不存在的。期望的结果被
所有可能结果否定是大量重复性事件系统的一个性质,不论这个事件的
数目是有限的还是无限的。并且,如轮盘故事展示的,用于单个事件的
概率论,即所谓的单事件概率,被频率论者默默使用着,尽管他们无法
定义它。图2.1
为了宣称他的硬币是公平的,事实上鲍勃必须拒绝轮盘类比并且做
出依赖于一些不言而喻的假设的论证。他必须假设100次投掷硬币是彼
此独立的,且出现正面的概率对每一次投掷都是一样的。但是,即使是
这样也远远不够。如果他做出这些假设并且用12作为出现正面的概率
的数值,他得到所观察的序列的概率是极小的,为 [数字( 小得
令人难以想象,它代表着把米尺对半切100次,并且非常巧合的是,在
米制单位中,它仅仅比普朗克常数大一点点]。不幸的是,鲍勃对这个
无穷小的概率无能为力。就像爱丽丝获得11这个数字的137概率,并无
助于公平性一样。特别是,即使非公平的硬币可以产生鲍勃所观察到的
正反面的序列。鲍勃必须深究这个理论,不再假设投掷硬币正面概率是
12这一假设,而是考虑其他的概率。假设值是0.7或0.2,则分别意味着
偏向或者偏离正面,他必须对特定的序列的概率进行重复计算。只有在这个时候,他才能得到一个有益的结果:他计算所观察到的概率,尽管
很小,当假设概率是0.5的时候远比假设硬币有偏差的时候大。这里,我们最终得到这个问题的数学答案:硬币是公平的吗?是的,因为概率
12是在数量上最可能的假设。
注意到鲍勃是被迫那么做的。他一遍又一遍地涉及单个、孤立的投
掷硬币的概率,即单事件概率。首先他必须假设每一次投掷的概率都是
一样的,这个声明只在概率是定义在单次投掷的情况下才有意义。其
次,为了找到在整个序列中概率最大的序列,他将每个真实的数值分配
给单事件概率。只有当特殊值最终出现在0.5附近,才能够宣称这个硬
币是公平的。
马库斯·阿普尔比得出结论,频率概率并不仅仅基于大量的实验,无论是有限还是无限。为了保持一致,它必须承认单事件概率作为最基
本的元素,如同概率论中的“原子”一样。简而言之,频率论并不自洽。
在他的文章最后,阿普尔比感谢了量子贝叶斯理论的共同创始人克
里斯,因为他让阿普尔比“看到了问题的重要性”。这个感谢暗示了量子
贝叶斯者所面临的艰难战役。物理圈中我的大部分同事并没有意识到频
率论的观念所存在的问题,他们也领会不到这个问题的重要性。
[1] D.M.Appleby,“Probabilities Are Single-Case,or Nothing”,Optics and
Spectroscopy,99(2005):447–462,http:arxiv.orgabsquant-ph0408058.第10节 贝叶斯牧师的概率
量子贝叶斯理论(QBism)建立在贝叶斯统计的基础之上。贝叶斯
统计是概率解释一个流派,以托马斯·贝叶斯(Thomas Bayes,1701—
1761)牧师命名。他是长老会的一名牧师,同时也是非常有才能的数学
家和统计学家。他因一篇死后才发表的论文出名,在这篇论文中他提出
了现在被称为贝叶斯定律(Bayes’law
[1]
,也称为贝叶斯定理、规则、公式、方程)的定律。贝叶斯概率理论最初由著名的天文学家和数学家
皮埃尔·西蒙·拉普拉斯(1749—1827)开创,经过随后几代学者的努
力,现在正在蓬勃发展。其中贝叶斯定理是贝叶斯概率理论的核心。
拉普拉斯之后的一个世纪,概率和统计理论在贝叶斯定理的传统中
平稳发展。为了使概率更加“客观化”,一些数学家在重复试验中引入频
率的定义。约翰·维恩(1834—1923)就是其中著名的一个,说起他,我们首先想起的就是以他名字命名的维恩图。我们耳熟能详的简单的公
式“事件发生次数除以总试验次数”已是学校概率课程中的基本内容。物
理学家也采用了这种频率论,因为物理实验通常是简单的、可重复、可
量化的。而其他的科学则往往没有这么简单,尤其是生物学、心理学、经济学、医学。这些学科实验中的不确定性通常相当大,很难实现毫不
含糊的实验。但是学者仍试图将它们联系到假想的可无穷次重复的实
验。20世纪中期,情况有所转变,人们开始考虑更古老的贝叶斯理论作
为取代频率论者的一个选择。天文学家和物理学家也面临着大量的数
据,需要统计分析处理,他们也开始重新发掘贝叶斯理论
[2]。最终,在千禧年之际,量子物理学家也赶上了这个潮流,量子贝叶斯理论诞生
了。
经过数学家、统计学家以及数学哲学家对贝叶斯概率概念更深入地分析和重新组装,最终使最初的贝叶斯理论更加丰富,并产生了大量的
变种。量子贝叶斯理论正是基于贝叶斯理论其中一个版本,被称为“个
人的”(personalist)或者“主观的”(subjective)贝叶斯概率。本书中,我只考虑这一版本。
概率就是测量事件发生的可能性。在我们日常对话中,可能性通常
被表达为下面这些语句,例如不可能、不太可能、也许、不好说、可
能、很有可能、十拿九稳、必然的、毫无疑问等,但是在科学中最好是
将概率赋予对应的值。对于理想简单的情况下,例如,抛硬币或者发射
电子,频率概率论仍是可行的,因为这类情况可以在可控的条件下试
验。但是为了做到逻辑自洽,也出于实际应用的角度,我们需要定义可
用于单独事件的概率。频率论做不到这一点。
贝叶斯理论认为概率并不是寄存于外在物质世界,而在一个被称之
为代理人(agent )的意识中。在这一方面代理人(agent 来自拉丁语
agens ,意思为“做”)并不是其他人的代表,而是指能够做决定和执行
行动的人。贝叶斯概率测量的是代理人对某一事件是否发生或者命题是
否正确的置信程度(degree of belief )。代理人这个词使相关定义与真
实结果的可能性关联在一起——科学对那些不会影响真实世界的个人的
沉思并不感兴趣。“置信”(belief )意味着人和主观。它是由多种多样
的影响确定的——只有问题中的代理人完全确定它。贝叶斯理论者并不
试图深究或者评判代理人的“置信”的起源。
但是贝叶斯理论想要量化置信的“程度”。那么该如何测量相信的强
度呢?除非它导致某种外界可辨识的行为,否则你不可能测量到。将定
性的估计转化为数字等同于将赌博形式化。这样看来代理人的身份很像
一个赌徒。在这场“赌博”中,我们暂且不管他是如何做出决定的,但是
他愿意拿出赌注的多少可以用来刻画他对某件事可能发生的概率的估
计。因此概率理论又回到了赌博和博弈游戏。为了使赌博的过程更标准
化,而且能够保证这样测量出的概率对应着0和1之间的实数(或者百分率),为了定义贝叶斯概率,我们先做出下面这些假设:赌博当事人都
有一些债券,并且约定当某一事件E 发生时,债券的卖方须给买方1元
钱。一旦赌徒都同意事件E 的准确的定义,他们就可以自由交易债券。
如果一个人认为某件事E 一定会发生,例如,太阳在明天会升起来,那
么他将这件事发生的概率赋值为1。于是他肯定愿意用低于1元钱的任意
价格买下债券(为什么要低于1元?这是因为如果他用1元买下债券,那
么他不可能盈利,这是一个愚蠢的选择)。相反,如果他觉得事件E 不
会发生,例如,他的咖啡杯在他松手后会飘浮在天花板上,那么他将赋
值概率为0,同时不购买债券。
类似步骤可以推广到那些既不是完全确定也非不可能的事件。例
如,抛硬币这个例子,代理人在学校学到或者根据他自己的经验知道得
到正面向上(这个例子中的事件E )的概率是12,因此他最多愿以0.5
元的价格买一张债券。如果硬币是正面朝上,那么他会获得1元,这样
他就净赚0.5元或者更多。相反,如果是反面朝上,那么他就损失了购
买债券的钱。
有了这些背景我们就可以介绍贝叶斯概率正式的定义。代理人对某
事件E 发生的概率赋值为p 意味着他最多愿意以p 元的价格购买一张债
券,如果事件E 发生,那么债券值1元。相反,代理人也愿意以高于或
者等于p 元的价格卖出一张债券。
和频率论的概率一样,这样定义的概率取值在0和1之间(包括0和
1)。虽然它们外在有相似之处,但是这两种定义相去甚远。对于在某
种传统中长大的人,往往都很难完全转向新的观点。不像更换一个新牙
刷那么轻易,对概率新奇的理解不可能一夜间取代旧的观念。因此,虽
然量子贝叶斯理论并没有给物理学带来暴风雨般的影响,但是目前也没
有什么能阻碍它的发展或能够立刻排除它。在许多科学与技术领域,贝
叶斯概率作为可靠有效的工具已经充分体现了它的价值,量子贝叶斯理
论则将成果扩展到量子力学的领域。包括我在内的很多物理学家在第一次遇到贝叶斯概率时通常都会大
吃一惊。谈论“置信程度”似乎和物理学传统的观念完全不相容。物理学
家往往都会觉得“自然伟大的定律”与主观意识或者个别代理人的信赖毫
不相干。相反,频率主义虽脱离现实世界,却成为枯燥无味的学术演讲
和课本中的基本内容。贝叶斯理论认为概率能预言单个事件的观测量,频率论者则拒绝接受,他们认为,当为将来的行为做决定时,概率是不
相关的。当我看到天气预报说今天下午会有70%的概率下雨时,其实并
没有告知我下午一定会发生什么,天气预报并没有帮助我决定是否带雨
伞或者什么时候离开家。事实上,天气预报确实是有用的,可以将70%
的预测理解为我对下午会发生的事情的“置信程度”,而且天气预报确实
影响了我的决定。
如果将物理学看作人类史诗般的冒险而非收集一些枯燥的事实,那
么物理学家也需要不断地做出决定,而且他们的决定是基于已有置信程
度。每次评估数据,每次开始新的计算,实验中的每次决定、每次争论
和每次下结论,旅途中的每一步都需要在许多选择中做出决定。对单个
事件的概率的估计在其中起到重要作用。
贝叶斯概率和频率论的最大区别莫过于概率的变化。个人的置信程
度的变化也就意味着赋予概率的值也会不同。频率论概率一旦定义就不
再会变化,抛硬币就是最好的一个例子。但是贝叶斯概率则与人的思想
有关,是可以不断变化的。因此除了帮助做决定外,贝叶斯概率也会不
断地修正。这种可塑性也正是贝叶斯概率起初的出发点。当获得了新的
证据,修改了之前的置信程度时,贝叶斯概率就会发生相应的变化,贝
叶斯定理就是反映概率变化的数学描述(回想一下上一节中对那个赌徒
我为何改变自己的主意)。
设想你知道或者假设某个特定事件发生的概率的大小,之后你偶然
获得了新的相关的信息,例如,一个新的实验结果或者一些不可预料的
新内容。贝叶斯定理告诉你的正是下面这个问题的答案:新的信息是如何改变你的概率估计的?
贝叶斯定理的价值在于它数学上的严格性。概率即置信度,和“事
实”不同,它是可塑的。但是概率和新的信息怎么组合在一起产生一个
修正的概率呢?这个步骤由数学公式决定,和勾股定理一样直接且毋庸
置疑。
下面举个例子来说明这个定理。设想有一种癌症,在大众中发病率
为0.5%,也就是说平均两百个人中有一个人患有该病。再假设一项新的
血液化验能以99%的准确度检测你是否患有此病。医生怀疑你患有此
病,因此采集了你的血液样本,并送去检测。几天以后,他打电话告诉
你化验结果已经出来,是阳性。
那么你确实得了这种癌症的概率是多少呢?你应该对此有多担心
呢?考虑到这种化验是十分可靠的,你是否应该设想最坏的结果?此时
你是否应该通知朋友和家人?你是不是应该再去做其他的测验?你又该
如何通过合理评估自己的机会来平复自己越发焦虑的心情?是否存在微
弱的希望——你并没有得癌症,只是化验结果是错误的,通常称之为假
阳性?
贝叶斯定理提供给我们一种有序的方法来思考这些问题。它涉及四
种不同的概率,每一种都可以表示为0和1之间的数字或者百分比。我们
将新的信息,即化验结果为阳性,记成加号+,这个问题中的事件E ,即你确实患有该病,记为一个表情符号L 。“阳性的结果意味着你确实
患有癌症”这句话的置信度对应的数字记为p (+→L)。这就是你应该寻求
的数字,这个概率左右着你的感觉。
第二种贝叶斯定理涉及下面这个事件的概率:给所有人都做了这种
化验,且结果都为阳性。我们将它记为p (+)。
我们还需要第三种概率,记为p (L ),它对应着做测验前你得癌症的概率。这只是开始我们提到的这种癌症在大众中的发病率,即0.5%。
第四种概率是整个计算中的关键。我们将它记为p (L →+)。或许你
已经从记号中看出,它在某种程度上是第一种概率的反转。它对应“你
确定自己患有这种癌症,化验结果为阳性”的概率。注意,不是“如果我
的化验为阳性,那么我确实患有这种癌症的概率是多少”,而是“如果我
确实得了癌症,那么化验结果是阳性的概率是多少”混淆这两类问题会
产生很多误会。“大多数罪犯都是男性”和“大多数男性都是罪犯”这两个
表达的意义是完全不同的,那两个问题的区别也与此类似。
现在我们已经有了贝叶斯定理的构件。贝叶斯定理就是下面这个简
单的等式。
p(+)×p(+→L)=p(L)×p(L→+)
直观地看,它非常容易理解。将上面的概率写成百分比的形式,它
表达的是一个显然的事实。在所有人中,找出化验结果为阳性的人p
(+),在这些人中再筛选出那些确实得了该癌症的人p (+→L )。或者,你
可以用另外一种方式,先选出那些确实得癌症的人p (L ),在这些人中
再筛选出化验结果为阳性的人p (L →+)。两种不同的方式你最终筛选出
来的都是同一群人,即那些得了该癌症且测量结果为阳性的人。
下面我们用具体数字计算。
这种癌症的发病率为p (L )=0.5%。等式右边的第二项p (L →+)估
算的是一个人得了该癌症,化验结果为阳性的可能性。由于这个化验是
如此的可靠,可以用p (L →+)≈100%作为很好的近似。当你的医生打
电话告诉你坏消息时,正是这个数字引起你的焦虑。知道这个化验是几
乎百分之百的准确,大多数人直觉上都会感到阳性的化验结果几乎肯定
意味着确诊患有该癌症。但是他们都错了!最诡异的是公式中的p (+),它反映的是在人群中做化验后结果
为阳性的概率。0.5%的人确实患有该癌症,因此他们的化验结果极有可
能为阳性。但是健康人群(整个人群的绝大多数)中的1%会不幸得到
一个错误的化验结果——假阳性,因此整个人群的化验结果为阳性的比
例p (+)≈1.5%。
将上面的数字带入等式,左右两边同时除以p (+)。那么在知道
你的化验结果为阳性时,你患病的概率为p (+→L )
≈0.5%×100%1.5%=100%3≈33%。(注意中间一步分子分母中出现的两
个%消掉了)。贝叶斯定理告诉你患病的概率只有大约13。统计数据告
诉你患该病的概率是0.5%,而化验结果本身则暗示你患病的概率是
100%,但贝叶斯定理的结果则是一个合理的折中。真叫人宽慰!你需
要明智地再做一次化验。由于不太可能恰好两次都是假阳性,重复化验
会极大地降低不确定性——更好的结果或者更坏的结果。
图2.2下面这个被奇怪分割的饼状图描绘的是群体数为1万人的真实统计
数据,从中你可以得到(大概)的百分比。被标记49和99的那两部分都
是化验结果是阳性的人群。由于你在这两类中的其中一种内,但是你并
不知道在哪个人群中(见图2.2),因此你患病的概率是13,这正是贝
叶斯定理预言的结果。对于更一般的情况,+可以用I 代替,意思是新的
信息,表情符号L 用E ,意思是某事件。做了这些替换之后,再将等式
两边同时除以P (I ),我们就得到了贝叶斯定理的常见的形式:
p(I→E)=p(E)×p(E→I)p(I)
在某种程度上来说,这两个条目组成了汉堡的牛排和芝士,而另外
两个则组成了汉堡的小面包。等式右边第一项p (E )指没考虑新的信
息I 时事件E 发生的概率。由于这个原因p (E )也被称为先验概率
(prior probability )。有时它只是开始不知情状况下的一个猜想,我们
期待着反复使用贝叶斯定理可以不断改善它。等式左右边的p (I →E )
指事件E 在获取新的信息I 之后修正过的新(或者后验)概率。另外两
项则影响着修正过程。通过简单的规则不断修正先验概率是贝叶斯概率
的核心
[3]。
在上面那个癌症例子中,接到医生的电话之前你自己对患病概率的
估计——先验概率——是0.5%。知道化验结果之后,你担心自己患病概
率几乎上升为100%,这也是不正确的。贝叶斯定理显示这个概率被修
正为33%。
贝叶斯定理的强大之处在于它能够将不同来源的信息组合起来。频
率论除了对一些均匀的数据集合外很难做到这一点。上面的例子中先验
概率源于人群中大规模的统计研究,然而癌症化验的准确性大概是基于
一些特定的临床试验。贝叶斯定理的计算不仅可以利用一些数据资料,甚至历史或者直觉都能帮助代理人选择先验概率然后不断修正。上一节
那个会堂中的赌徒例子,据说他连续100次都是正面向上,因此我才会决定不和他赌博,这说明了现实生活中引入新的信息并改变相应的概率
估计是非常有用的,只要把概率定义为置信程度。
相比于频率论,贝叶斯理论更普遍,逻辑清楚,且用途广泛,因此
它渐渐被接纳为概率基本的解释。气候学对唯一的大气层做出预测,需
要从各种各样的来源收集证据和信息,贝叶斯概率理论则是经常被用到
的数学工具。其他学科,包括社会科学、生物学、药学和工程学,都在
用贝叶斯概率。频率论中简单的公式“事件发生次数除以总试验次数”可
以得到概率的数值,但是贝叶斯理论提供了这些数字的真正的含义。下
面这个测量一张奇怪形状纸的面积的例子能展现测定和定义的本质差
别:虽然面积可以通过纸的重量(单位:克)除以密度(单位:克平
方米)得到,但面积的含义是完全几何的,与重量和密度无关。
前面我们已经知道,量子力学在根本上也是依赖于概率的,让我们
拭目以待,当贝叶斯概率遇上量子力学会碰撞出什么火花?
[1] 英文Bayes’是Bayes’s和Bayes折中后的形式。
[2] 可参考W.T.Eadie,D.Drijard,F.E.James,M.Roos,and B.Sadoulet,Statistical Methods in
Experimental Physics(Geneva,Switzerland:CERN,1971)。
[3] 需要指出的是,当先验概率是0或者1时,新的信息并不会改变它。第三章 量子贝叶斯理论
第11节 量子贝叶斯理论使事情明晰
就像水面宽阔的河流在流向大海的过程中是通过吸收很多小溪小河
逐渐变大一样,科学也在兼收并蓄着各种新的数据和知识的细流中前
进。形成鲜明对比的是,量子贝叶斯理论则是汇聚了两条大的支流。21
世纪初,作为一门古老而又复杂的学科,量子力学和始于18世纪、最近
复兴的数学分支——贝叶斯概率结合起来,形成各种已经确定的知识的
汇集。量子贝叶斯理论的创造者既没有创造Q 也没有发明B ,而是将它
们结合在一起,不仅对量子力学本身,而且对一般的科学世界观也有着
深远的影响。
量子贝叶斯理论的基本论点很简单:量子概率是个人置信程度的数
值衡量。
如果你不曾听过贝叶斯概率,那么这个命题看上去会很奇怪。科学
的整个关键不就是排除主观性而支持一般性吗?难道信念不是知识的对
立面,因而也是科学的对立面吗?这是在看到发表于2012年的量子贝叶
斯理论奠基文章时大部分物理学家的反应,也是在闻知它的时候我的感
受。这篇文章开门见山地在文章名字“量子概率作为贝叶斯概率”中宣告
了它那令人吃惊的结论。
从频率论转换到贝叶斯概率的解释,这个决定是源于某种成本效
益的分析。一方面,询问下面这个问题是很公平的:在这个变化中你得
到了什么?另一方面,它的副作用是什么?采取这种飞跃的代价是什么?
采用量子贝叶斯理论的代价并没有它看上去那么大,因为贝叶斯理
论有充分的根据。以个人对打赌胜算来解释概率,尽管对大部分人来说
最初会感到不安,但是它不仅比频率概率更早,也在大部分不相同的领
域中逐渐被越来越多的科学家和工程师采用。它已经存续了数个世纪,且在数不清的重大应用中都经受住了检验。对它熟悉之后,它就一点也
不奇怪了。
从积极的方面说,量子贝叶斯理论提供了相当多的益处,其中最令
人信服的莫过于解决了令人烦恼的波函数塌缩问题。在传统量子力学
中,波函数塌缩的直接原因一直悬而未决。它在时间与空间中是如何发
生的,并没有数学描述,而在经典物理中,其他的每一个过程都有这种
描述。力学的、电的、磁的、光的、声的以及热的扰动是如何从一个点
传播到另一个点,以及影响附近和远处的物体,都能以非常严谨的数学
方程展现出来。即使将我们束缚在一起的引力效应,也可以通过广义相
对论烦琐的数学方程,从我们这里开始逐步地到达某个星体然后再传播
回来理解。但是波函数的塌缩依旧是不可思议的,如同扎在数学物理中
的一根刺。
量子贝叶斯理论轻松而且优雅地解决了这个问题。在任何实验中,计算好的波函数为随后的实证观测提供了先验概率。一旦做出观测,比
如,粒子留下痕迹,探测器有撞击,确定自旋方向,操作实验的代理人
就获得了新的信息。利用这些信息,代理人只是瞬间地更新它的概率以
及波函数,并没有什么神奇的事情。塌缩去除了它的神秘之处。贝叶斯
定理描述了这个过程,并最终使失去的这部分显现出来。
实现这个过程的方式是如此直观。考虑一个例子:在纽约的爱丽
丝,拿起两张扑克,一张黑的,一张红的,并将它们装进两个独立的无
标记的信封中,密封好后重新洗牌。为了确保它们不可区分,她也让鲍
勃去洗牌。她保留一个信封在她手袋中并将另一个交给鲍勃。然后爱丽丝前往澳大利亚,在她打开信封之前,相信鲍勃拥有红牌的概率是
50%。一旦抵达澳大利亚,只要打开她自己的信封,她就会知道一万两
千英里之外的鲍勃的信封中装的是什么,这时她的置信程度就瞬间变成
了100%或0。同时,不论爱丽丝手中是什么,鲍勃关于爱丽丝手中卡牌
颜色的猜测不会因她的行为而改变。这里没有什么奇迹发生。
量子波函数的塌缩遵循着相同的逻辑,但是有一个很重要的区别。
在经典的例子中,由始至终,因果链都不曾被打破。一个客观物体,以
被密封在信封中的卡牌的形式,在爱丽丝的手袋中携带着信息。卡牌就
像一个神秘的信使——物理学家所称的携带着一些红值或黑值的隐变量
(hidden variable )的一个例子。在经典物理中,爱丽丝的无视掩盖了
这个值,但是原则上,她可以在旅途中任何时间打开信封,从而得到这
个值。在量子力学中,信封中没有卡牌,没有客观的机制去携带秘密信
息,也没有隐变量。甚至在原则上,我们也没有办法弄清电子在哪里,以及在它被撞击和被探测到这段时间内它自旋的指向。事实上,隐变量
不存在是可以而且已经在实验中证实的一个断言,我们将在下文中得到
这个结论。
当我开始理解量子贝叶斯理论时,以及意识到仅仅通过给概率一个
更好的定义,我就可以不用再苦苦思考波函数塌缩的意义了,我突然有
一种释放并且接近于愉悦的感觉。“当然,”我对自己说道,“这就是它
如何运作的。”这是一种不期而遇且不应有的启蒙的美好感觉,也是我
个人的那种“啊,有了”的时刻。
就像将波函数塌缩解释成简简单单的概率更新是不够的,量子贝叶
斯理论完成了另外一个同等有意义的澄清。在1961年,恰好是我开始职
业生涯的时候,量子力学先驱之一尤金·魏格纳(Eugene Wigner,1902
—1995)指出了一个量子力学基础上的模糊之处,它被熟知为魏格纳的
友人悖论(paradox of Wigners’friend ),它也可以被等价称为“总之,它是谁的波函数”?魏格纳和他的朋友一起做实验,并且他们都同意一个电子自旋可以由一个自旋向上和向下叠加态的量子位波函数描述。实
验运行后,计数器记录结果。他的朋友读取计数器,而魏格纳背对着仪
器,直到知道实验结束。他的朋友知道波函数已经塌缩到自旋向上的结
果。另外,魏格纳知道测量已经结束但是不知道结果。如之前那样,他
所分配的波函数是两个可能结果的叠加,但是现在他将电子的量子位和
计数器的读数以及他朋友对读数的信息联系在一起,而这个信息魏格纳
却不知道。
那么,谁是对的?量子位已经塌缩,还是仍处于叠加态中?只要波
函数作为一种真实的东西,或者一个真实过程的描述,那么这个问题将
不比柏克莱主教(Bishop Berkeley)那关于树在森林里的臭名昭著的问
题简单:当一棵树在森林里倒下时,并没有人听到,那么它是否发出声
音了?答案已经争议了3个世纪,并且还在继续引发争论。爱因斯坦思
考事情总是通过自己思考而不是依赖权威,也曾以不同的方式表达过相
同的问题。他的同事——恩斯特·帕斯夸尔·约尔丹(Ernst Pascual
Jordan)追忆道:“我们经常讨论他关于客观实在的见解。我记得在一次
散步时,爱因斯坦突然停住,转身问我是否相信月亮只有我们在看它的
时候才存在?”魏格纳的友人的问题,即谁的波函数和谁的概率分配是
对的?揭示了概率这个词的含义,并且它如同柏克莱的问题一样饱受争
议。
但是对于量子贝叶斯理论者而言,这些都不是问题:魏格纳和他的
朋友都是对的。每一个人分配的波函数反映了他们所能得到的信息,且
既然他们各自编辑的信息不同,他们的波函数也就不同了。只要魏格纳
自己看一下计数器或者从他朋友那里听到结果,他可以用新的信息更新
他的波函数,然后两个人在塌缩的波函数这个问题上就再次一致了。
当下面的疑问提出的时候,魏格纳的友人的问题就出现了:谁是对
的?换句话说,什么是正确的电子波函数?根据量子贝叶斯理论,没有
一个独一无二的波函数。波函数并不是被束缚在电子上的,也不是像圣徒头上萦绕的光环那样一直伴随左右——它们是由代理人分配的并且依
赖于代理人所能得到的信息。简而言之,波函数以及量子概率是贝叶斯
型的。
这个简洁的声明——量子贝叶斯理论宣言,如果你愿意这么叫的话
——足够短甚至可以将它印在T恤上,但是却带来了思考世界的新方
式。第12节 量子贝叶斯理论拯救薛定谔的猫
薛定谔的猫也许是这个世界上最有名的猫了,但不是所有的物理学
家都喜欢它。我曾经参加了斯蒂芬·霍金(Stephen Hawking)的一个报
告,报告中他用他的声音合成器呆板而有节奏地喊道:“当我听别人说
起薛定谔的猫时,我就会拿起我的枪。”量子贝叶斯的先驱克里斯同样
不喜欢这个动物,并且告诉我,他总是更倾向于担忧魏格纳的友人。这
只猫也是它名气的受害者。流行文化总是用许多误解、嘲弄和彻底无意
义的内容包装这个故事,以至于物理学家对它避而远之。它已有80多岁
的高龄,但由于它仍能够有效地阐明观点,我将再次使它复活。
这里是设置:一只活着的猫和由一个盖革计数器(Geiger
counter),被中子撞击而产生辐射的原子,一把锤子,以及一小瓶毒药
组成的鲁布·哥德堡装置,被封闭在一个盒子里面。当原子衰变时,就
像它最终会发生的那样,盖革计数器嘀嗒一声,并且释放一个电子信
号,而这个信号可以触发锤子,它会锤碎小瓶子,释放出毒气,而毒气
会马上无痛地杀死猫(见图3.1)。图3.1
问题是物理学家如何描述这个实验?一个辐射的粒子是与一个由量
子位所代表的波函数联系在一起的,而量子位的北极由0标记,代表着
原来的态,而南极由1标记,代表着衰变的态。从波函数推断得到的概
率以一个熟知且一直减少的速率平滑地从0态下降到1态。经历原子的半
衰期之后,量子位到达了球的赤道处,即50%原来的态和50%衰变的态
混合。如果此刻你观测原子,那么你将有50%的概率发现它衰变了。
根据传统量子力学的解释,即在薛定谔创造他的猫的时候所流行的
观点,注意到量子位的值是(除了极点)“0和1”的混合这点很重要。它
不是“0或1”。杨的经典双缝实验极其着重地展示了这点。为了使干涉出
现,光必须通过两个双缝而不是其中一个或另一个。采用同样的记号,量子位球上的一个点不是代表着二选一而是这个问题中量子事件的可能
结果的叠加。量子干涉效应就像肥皂泡上的颜色一样实在而且可观测,并且我们所知的能够描述它们的方式是“既……又”形式的叠加。
迄今为止,所有这些都是传统量子力学且无可争辩的。无数的实验
已经展示了这是描述辐射原子的正确方式。问题出在当你从原子上产生
干涉变成猫本身的干涉。假设你并没有打开箱子,在原子半衰期之后,猫的状态是什么?猫的命运和原子立刻联系在了一起——“纠缠”是薛定
谔引入英语的一个令人回味的词。一个完整的原子意味着活着的猫,一
个衰变的原子意味着死亡的猫。这看上去就像遵循着如下规律,既然原
子的波函数是毫无疑问地处于叠加,那么猫的状态也是:它既是死的又
是活的。一旦你打开箱子,那么这个悖论就消失了,猫就像常识所述的
那样,要么死要么活。但是只要箱子没打开,猫同时是死的和活的这个
奇怪的断言又是怎么回事呢?
薛定谔捏造了这个故事,目的是将量子奇异从单个原子以及它们的
波函数的模糊性带入到人类日常经验中。他试图戏剧化描述出两个不同
领域之间的差别。在过去90年间出现了很多关于量子力学的其他解释,发展这些的很多动力都是源于数学上阐明这个猫的处境。
量子贝叶斯理论如同处理波函数塌缩的奇迹以及魏格纳友人的悖论
那样毫不费力地处理了这个故事。这张图不是疆域图!原子的波函数并
不是对原子的描述。描述原子的量子位,是一个特定代理人对将来观察
的打赌胜算的置信程度的概括——不多也不少。在原子被观测前,它的
状态是数学上定义的而不是我们观察之后所用的。根据量子贝叶斯理论
的观点,一个未被观测的原子,或者一枚量子硬币,或者那件事中的猫
的态,是没有一点价值的。量子位球赤道上的一个点不是现实世界中任
何一个东西的符号——它仅仅代表着预测将来观察结果的概率的一个抽
象的数学表达式:0或1,未衰变或衰变的,死亡或生存。
宣称猫是死的和活的如同在硬币仍然在空气中翻腾时宣称硬币既是正面也是反面,以及赛马开始前宣称马赢了和输了一样毫无意义。概率
论总结了转动的硬币的状态,给它分配结果是正面的概率为12。赛马
场上的计数板列出了各匹马赢的概率。同样地,量子贝叶斯理论拒绝描
述箱子被打开前猫的状态,并且将它从盘旋在生与死的监狱中解救了出
来。
远在量子贝叶斯理论诞生之前,描述这个结论的一个难以忘记的方
式在1978年就被理论物理学家阿瑟·佩列斯(Asher Peres,1934—2005)
明确表达出来了。他注意到,像薛定谔的猫那样的故事中涉及一个“要
是”(what if)的问题:要是我们能在盒子仍关闭着时看这只猫呢?佩
列斯得出结论,量子力学不允许“要是”问题,并且创造了引人注目的口
号:“没有完成的实验没有结果。”经典物理当然允许在箱子打开前想象
箱子里有什么。这个经典思想实验的结果是猫是死的或者活的。在量子
力学,有一个定义完好的方式描述系统处于两个可能状态中的一个,0
态或者1态。这种描述的数学工具是一个经典比特——信息技术中通用
的拨动开关。但是对于一个辐射原子的波函数来说,比特是不够的。在
量子力学中取代比特的量子位在测量发生前没有值。用比特而不是量子
位描述原子将会导致与实验很直接的冲突。
佩列斯的构想实质上就是意义深远的量子贝叶斯理论的精神。就像
量子贝叶斯理论主张的那样,假如波函数除了告诉将来实验结果的概率
之外并没有透露关于原子或者任何其他量子力学客体的信息,那么代理
人甚至不会有兴趣过早地推测原子和猫的状态。在箱子打开之前未完成
的观测盒子的实验并没有结果,即使是推断性的结果。
根据量子贝叶斯理论的解释,原子和猫纠缠的波函数并不意味着猫
是死的和活的。相反,它告诉代理人当打开箱子时,他能合理地期望发
现什么。第13节 量子贝叶斯理论的根源
尽管量子贝叶斯理论是21世纪的革新产物,但它的根源却可以追溯
到古希腊原子论者。生活在公元前4世纪的德谟克利特(Democritus)教
导道:“甜是依照惯例而言的 ......
定谔的猫
[美]汉斯·克里斯蒂安·冯·贝耶尔 著
郭武中 阮坤明 译
中信出版社目录
前言
第一章 量子力学
第1节 量子力学的诞生
第2节 光的粒子
第3节 波粒二象性
第4节 波函数
第5节 “最优美的物理学实验”
第6节 见证奇迹的时刻
第7节 量子不确定性
第8节 最简单的波函数
第二章 概率
第9节 概率的烦恼
第10节 贝叶斯牧师的概率
第三章 量子贝叶斯理论
第11节 量子贝叶斯理论使事情明晰
第12节 量子贝叶斯理论拯救薛定谔的猫
第13节 量子贝叶斯理论的根源
第14节 实验室中的量子怪异
第15节 物理现象都是定域的
第16节 信念与必然第四章 量子贝叶斯者的世界观
第17节 物理和人类经验
第18节 自然定律
第19节 石头反踢一脚
第20节 现在的问题
第21节 一张完美的地图
第22节 未来之路
附录 量子力学的四种其他解释
后记
版权页献给芭芭拉(Barbara)前言
退休后,我成为一名量子力学补锅匠。在大学里教了五十年的量子
力学,研究生涯中玩弄着数学的奇技淫巧,挣扎着通过各式各样的报
告、文章、书籍以及电视节目将量子物理福音带给普罗大众之后,量子
力学给我的人生留下了深深的印迹。它点缀了我思考宇宙的方式。
然而,自从高中开始,在我发现乔治·加莫夫(George Gamow)的
经典故事集《汤普金先生》(Mr.Tompkins stories )中所描绘的量子撞
球和量子丛林的魔幻世界之后,我备受量子力学带来的不安情绪的折
磨。到目前为止,它行之有效,且从未让我抑或是其他人失望。然而,尽管使用它并且在大学里教授它,我内心深处却觉得自己并没有真的理
解它!我感觉自己不过是在重复着量子先哲们精心设计的步骤。像所有
物理学家一样,我熟悉牛顿物理,也即经典物理,且当情势需要时,我
可以如同传道者一样引经据典,对答如流,飞快说出它的教令、篇章,口若悬河地去描述它,然而我却从未能这样熟悉量子力学。量子力学的
奇幻之处并不在于它数学式的复杂,而在于与生俱来的的悖论和难解之
谜。
其中最著名的谜题莫过于薛定谔的那只倒霉的猫的故事——根据量
子力学的假设,这只猫同时处于既生又死的状态。其他的难解之谜包含
了这样一条论断,即一个量子粒子可以在不同的位置上被同时观测到,这意味着粒子表现得像波一样,波则像粒子一样,而信息则似乎可以瞬
时传输。总而言之,这些谜被称为量子奇异(quantum weirdness )。
诺贝尔奖桂冠获得者——理查德·费曼给予我安慰。尽管他是二十
世纪最顶尖的量子物理学家,但是仍旧抱怨“没有人真的懂量子力学”,包括他自己!然而他这个极其悲痛的自嘲并未给予我太多的安慰。
随后,意外的事出现了。就在我计划着退休且从自己不会与量子力
学相处愉快的那种悲伤论断中撤退时,量子信息前沿领域专家克里斯托
弗·福克斯(Christopher Fuchs)的文章让我犹豫不决。尽管我并不是很
懂他的文章,但是这篇文章看上去很鼓舞人心。按照科学圈子的传统,我邀请他来到我的学术之家——弗吉尼亚州的威廉·玛丽学院做了一个
报告。他接受了邀请,因而我开始在他帮助下寻找量子力学的新解释。
它被称为量子贝叶斯理论,一语双关地简写成QBism,这么做的原因,我将在这本书中解释。这些年量子力学使我受益匪浅,且它激发了许多
设备的发明,这些发明逐步衍生出改变我们生活的整个工业,而量子贝
叶斯理论与量子力学的这些技术方面的应用无关。取而代之的是,量子
贝叶斯理论不过是在重新解释该理论的基本部分并赋予它们新的含义。
当我和克里斯托弗成为朋友之后,他很耐心地教导我如何驱散量子
奇异的迷雾。在一段时间里,我们相遇在一些国外的会议和研讨会上,诸如在瑞典古堡、加拿大高科技智囊团、瑞士山巅酒店以及巴黎的某个
阴郁的礼堂——每个地方,物理学家聚在一起争论着量子贝叶斯理论的
是与非。克里斯
[1]
和我联系密切,我们通过无数的电子邮件交流,我
们开怀畅饮。如晨曦照在身上加深了我对量子贝叶斯理论的理解。
尽管量子贝叶斯理论激进,但它并不难懂。我如此缓慢地才将它拥
入怀中,是因为传统的量子力学的成功,尽管存在着各种奇怪之处,但
是却令人震惊地解释了自然现象以及给出了可靠的预测。如同我这一代
人一样,我在一个传统的、被笑称为“闭嘴吧,快去计算”的物理学院接
受教育。我们被告知接受量子力学是一个事实,使用它去解释实验和设
计小物件,而不必担忧它的深层含义。
“运用它”是“闭嘴吧,快计算”的更礼貌的表述方式。我们被鼓励着
先搁置哲学上的顾虑,取而代之去成功解决实际问题。这种心态需要一点时间去适应。
我们这种自负的态度在千禧年之际伴随着量子信息理论的成熟而开
始改变,这个理论揭示了量子力学未知的魔力。这些被用于一些非常炫
酷的应用中,诸如量子加密(创造一种牢不可破的密码)和量子计算
(解决曾经被认为不可解决的问题)。前者已经有商业上的实现,而后
者据信不远的将来会变为现实。受科技上巨大进步的鼓舞,物理学界开
始用新的视角审视量子力学的真正的含义。年轻的研究者将不会因为表
达出对它的基础的研究兴趣而被当作白日梦者嗤之以鼻。赞扬克里斯和
他的合作者的研究成果受到关注和赞扬,虽然这是他们应得的,如同搅
拌着一个长久以来在炉眼上文火慢炖的锅。
当我看到量子贝叶斯理论的思想只是缓慢地在物理学界中传播时,我意识到是时候去为那些并不能轻易理解数学公式和方程的人写这本书
了。
大约25年前,在一本关于单个原子壮观的新图像对物理学的影响的
书中,我并非确信而只是非常期待地写道:“当前我们正在建立的对原
子理解的纽带……将赋予它更深的意义,直到某天一个意义深远而简单
地想法将解开量子的所有谜团。”当然,那一天还未到来,但是毫无疑
问,正如二十世纪显微镜学的进展使我们对原子有了更多了解,意义深
远而简单的量子贝叶斯理论将在二十一世纪促使我们对量子有更进一步
的理解。
本书第一章“量子力学”,主要以非数学的术语介绍传统的量子理
论。为了让读者对量子理论有更直观的感受,我通过人们熟悉的事物或
者日常经历这样的隐喻和类比方式来传达理论直观的意义。
第二章“概率”,在这章中我将转向讨论对概率的解释,通过比较我
们中学学习的“频率论”的方式解释概率与不太熟悉的贝叶斯概率之间的
差别。这些讨论的核心就是形式化的数学概率理论与其在现实世界应用之间的基本的但常常被人们忽略的差别。
在做好这些铺垫之后,本书的核心部分将描述如何将量子力学和贝
叶斯概率结合成量子贝叶斯理论,以及如何用这种新的观念来解决量子
奇异。
最后,“量子贝叶斯者的世界观”这一章稍微有些偏哲学,主要涉及
我们从量子贝叶斯理论中获得的最有意义的教训,或者说它的更深层的
意义,这是本书的重点。量子贝叶斯理论意味着一直以来的对世界的科
学观的支柱(另一支柱是相对论,译者按)看法的改变。基于量子贝叶
斯理论的观点,我们将在本章中接触到下面这些问题:什么是“自然规
律”的本质;这些规律能完全决定宇宙的演化吗;我们有自由意识去影
响这种演化吗;在物质世界中,我们既是其中的一部分又是观察者,我
们与物质世界的关系又是怎样的;什么是时间;人类认知的极限在哪
里;展望量子贝叶斯理论发展的前景。
量子贝叶斯理论并非旧酒装新瓶,也不仅仅是量子力学的另一种解
释。量子力学装饰了我的世界观,而量子贝叶斯理论改变了它。第一章 量子力学
[1]
第1节 量子力学的诞生
如量子力学创造者——德国物理学家马克斯·普朗克(Max Planck,1858—1947)所言,量子的诞生是“绝望时的孤注一掷”
[2]。1900年前
后,公共照明和私人照明由气体向电力过渡所带来的技术挑战,鼓舞着
物理学家去探索一个灼热的物体是如何发光的。当一个热的物体发光
时,如燃烧气体的火焰、发光灯泡的金属丝或者太阳会散发出不同颜色
的光。1900年,光已被人熟知为某种波,尽管当时并不清楚是什么在
动。光波如同水波和声波一样,由它们的振幅、波高以及频率来描述,而频率指的是记录者在一秒钟内记录的完整周期的数目,从一个波峰到
下一个波峰出现的过程被称为一个完整的周期
[3]。我们裸眼是看不到
这些周期的,但我们知道的是不同颜色的光线频率是不一样的。红光对
应着缓慢振荡,换言之就是低频,蓝光则表征着高频,即剧烈振荡(记
住,为了回想起红色是否意味着慢或者快的振荡,要记得那些比彩虹光
的振荡频率低的光被称为“红外”。相应英文前缀infra 表示着红外的意
思。比彩虹光频率高的光是紫外光,英文中一般用前缀ultra- ,意味超
出)。如同自然界常见的那样,在许多颜色光混合在一起的情况下,物
理学家会问:光的强度和频率有什么关系?用通俗的话来说,就是在彩
虹中,释放了多少红光,释放了多少黄光和蓝光,等等。
在普朗克所处的时代,实验家争相测量理想实验条件下光强和频率
之间最精确的关系图。当把频率设为横坐标轴,能量密度或者亮度设为
纵坐标轴时,这样的“辐射曲线”看起来像一座小山。释放出来最亮的光的颜色决定了山峰在哪里。举例来说,太阳光的辐射曲线的波峰就在光
谱的黄色部分。如图1.1,记录下来的红外以及红光并没有释放出太多
的能量。沿着更高频率方向过去,辐射曲线逐步上升,在黄色部分达到
了最高值,随后因为光的强度在蓝光、紫光以及不可见的紫外光处逐步
减弱而使曲线下降。
频率图1.1
理论家争相从基本物理原理出发去解释辐射曲线。普朗克在这个问
题上花费了数年时间,却只取得部分成功。在19世纪即将结束的几个月
里,他尝试着采用统计的手段,而这正是他之前所鄙夷的。
山形曲线在概率论和统计领域是很常见的。举个例子,考虑多次掷
一对骰子,并且画出你掷出2点、3点、4点一直到12点的次数。图1.2横
轴代表掷的值(两个骰子点数之和)——从2到12,纵轴则代表着每个
值出现的次数。可以肯定的是,你将最终得到一座小山,尽管并不是很
完美对称的,但是在两端会很低,而在靠近中间逐步上升直至在中间的
时候取得最大值,即在等于7的地方。关于这个形状的解释是基于如下思想,即实现给定的掷得点数方式的数目。只有一种方式获得2点(1,1),也只有一种方式获得12点(6,6)。
但是7点则能以不超过六种的方式获得:(1,6),(6,1),(2,5),(5,2),(3,4)和(4,3)。中间值3,4,5和6以及
8,9,10和11也是一样,每个值获得的方式都少于6种。当各种组合都
是平等出现的时候,获得方式最多的点数将会赢,因此图像中间的峰,即在7点处,就可以很合理地得到解释。
图1.2
普朗克开始对辐射曲线做类似的事情。为此,他不得不把一个连续
性问题转换成一个离散问题。骰子试验中横轴和纵轴都涉及数量,即两
者都测量为简单整数。与此相反,在辐射曲线中,光的频率则被测量为
从0到无穷的实数[彩虹并不只是由赤、橙、黄、绿、青、蓝、紫组
成,如罗伊·G.毕夫(Roy G.Biv)所言,而是由无穷的不可数的色彩构
成]。辐射曲线的纵轴也有很多问题。发热物体的能量同样是可测量但
是不可数的。想数出大小,普朗克不得不将光滑的辐射曲线近似为类似
于墨西哥金字塔一样的阶梯状。如果他让这些阶梯足够小,使这些阶梯小到难以感知到,这些锯齿形轮廓就可以被替换成光滑曲线。
尽管普朗克和同时代的一些科学家一样不相信原子的存在,但是他
想象力丰富。他知道一个炽热物体的热能是一些不可见运动的某种表现
形式。我们所感知到的热,事实是物体内部物质的不可见摇晃或者振荡
(你可以利用摩擦手掌或者用电钻钻一个硬物将运动转换成热)。基于
这种理解,普朗克提出了一个天才的模型,在该模型中,频率和能量都
是可数的。
最简单的储能以及以确定频率振荡的设备是谐振子(这个迷人
的“谐”字源于产生乐音的振荡)。一个谐振子或者简写成“振子”的例子
是:一个重物系在弹簧上,放在无摩擦的表面上,弹簧另一端固定在墙
上(见图1.3)。
其他例子如音叉、音乐设备和钟摆。当弹簧松开的时候,振子既无
动能也无储存在张开或压缩的弹簧中的势能。但是,当施加一些推力之
后,它的能量将从动能慢慢转换成势能。反过来,这个过程的频率是固
定的,大小用f 表示。如果没有摩擦,它的总能量是一个常数,优雅的
振动将一直持续下去。图1.3
作为权宜之计,拼接一些数学技巧,普朗克把炽热物体(如一个装
有正在燃烧的气体的小球)的总热能想象成物体内部分布着大量的没有
特定结构的微小振动,这些振动的功能仅仅是通过固定频率振动来储存
能量,以及一直以相同频率释放或者吸收光。它们并不是用来模拟其他
数不尽的气体性质,如化学成分、密度和电阻等。普朗克的模型难以捉
摸,但是却富有远见。
随后事实越发清晰,即普朗克想象的小玩意儿确实是真的。这些谐
振子就是组成发光球中振动的原子和分子,且事实上它们也释放和吸收
光(虚构的模型中这个坚硬的墙代表的是大质量的气体分子,使原子差
不多保持在其附近振动)。毫无疑问的是,原子的数量是巨大的,但是
依旧可数且具有确定的数目(尽管在实际操作中数出它们的个数并不现
实)。另外,正如他所言,普朗克谐振子“是单纯形式上的假设,并没
有赋予它太多的意义”。类似于掷骰子从2到12这11个分立的数字,普朗
克这个想象力上的大飞跃意义在于将一个范围内连续分布的频率分解成
一系列分立、可数的频率。
接下来,普朗克将纵轴,即辐射能量或者亮度分解成离散的阶梯,对应于骰子的每个值出现的次数。最后他做了一个闻所未闻的奇怪假
设,即每个谐振子只能储存少量且等额的原子能量,即普朗克所言
的“能量单元”。这是比仅仅分解纵轴更具意义的假设。对于每个谐振
子,他将其分为能量包,并认为能量包可能有不同大小,且依赖于频
率。假如能量包的能量为e ,那么谐振子能储存的总能量为0、e 、2e 、3e ,等等。这个序列不会趋向于无穷,因为炙热的球的能量只有那么
多,谐振子储存的能量最多是球的总能量,不可能更多。这个微妙之处
最终使计算变得不一样。这使计算很优雅且有限,而不是趋向于无穷。
为了预测实际实验的辐射曲线,普朗克必须弄明白e 的值。一个想
象中的能量包的能量有多大?由已知的知识,当振幅不变时,能量和频率成正比,普朗克假设单个包的能量和谐振子的频率(由f 表征)成正
比(振荡越快,能量越大)。数学上看来,就是基本的能量包等于一个
可调整的常数h 乘以频率(这个可调整的常数被称为参数,可以微调以
与环境相匹配)。公式表达即为:
e=hf
想象中充斥着储存在超大谐振子集合中的天文数字般的能量包,普
朗克依旧能够计算出总能量在谐振子中分布方式的个数,并且画出气体
球能量与频率的分布曲线。如同在掷骰子实验中一样,曲线的左端和右
端最终比中间部分要低很多。通过改变h 的数量级以及调整它的大小,普朗克以令人震惊的准确度重现了实验测量的辐射曲线。
尽管这个成就使他获得了诺贝尔奖,但是他长久以来希望他的能量
包只不过是计算上的应急之举,而一个新的改良的模型能够修复未破缺
的连续性。他不能简单地忽略常数h 或者让它消失,因为这个常数出现
在了实验室测量的真实辐射曲线对应的最终表达式中,但是他希望这些
小的谐振子和它们的微能量包仅仅是一个工具——就像将发光的网格线
投影到纸上,这只是用来辅助绘画,最终还是要把它关掉。
但是普朗克在计算谐振子和能量包上都犯了错。谐振子,如我之前
提到的,是原子和分子。能量包,则被称为量子(quanta ,量子的复
数,拉丁文中意为“数量”)。现在被命名为普朗克常数的参数h ,已经
是量子力学领域最基本的组成单元。普朗克绝望之下的小技巧最终被证
实是现代物理学诞生的开山之举。
在爱因斯坦那里,普朗克的小小的公式e=hf 变成了量子力学的象
征,就像E=mc
2 是相对论的象征一样。这两个方程中,后者的名声更
大,但是e=hf 却更加强大。相对论中能量和质量的关系是从更基本的相
对性原理推出的,与之不同的是,普朗克关于能量和频率之间的理论在
早期量子力学中则是一个没有解释的公理。现在,它被认为是量子力学的结果,而量子力学则依赖于更基本的原理。
在标准单位制下,h 的现代值
[4]
为:
h=0.000000000000000000000000000000000662606957焦耳秒
毫无疑问,科学计数法下表示为h ≈6.63×10-34 焦耳秒更方便,但是
写出代表许多个10的34个0的全部排列更直观地告诉我们在感官上无法
触及原子的世界。我们视觉上能够触及的范围,从100千米或者说是
1.0×105 米,到一个小头发丝的宽度1微米,或者说是1.0×10-5 米。超出
了这10的11个因子范围的尺度,我们需要用望远镜和显微镜形式的机械
性帮助。但是即使这样的机械性帮助仍旧无法抵达普朗克计算所需要的
难以想象的极小尺度。量子王国是通过理性思辨,而不是直接由感官,甚至都不是由我们的测量仪器去揭秘的。
普朗克如此不喜欢他的能量包,以至于他错过了他那小小公式的巨
大意义。它的内在意义留给了爱因斯坦。仅5年后,他推动了量子从便
利的数学虚构物向可测量的实在转变。爱因斯坦着手研究的是,能量是
否如同光一样在传播中保持分立性的特点。作为一个巴伐利亚诞生的
人,他曾经把这个问题用通俗的话表达出来:“尽管啤酒是一品脱一品
脱
[5]
地卖,但这并不意味着它是由不可分的品脱单位组成
[6]。”普朗
克认为物质内部有类似的单元组分,爱因斯坦则表示光本身就是由许多
能量包组成的,而这个组成成分被称为量子,随后被命名为光子。
古希腊的原子论哲学家曾经宣称,物质是由不可分的粒子组成的。
电子和携带电的不可切割的粒子,在19世纪末被发现。经过仔细考虑,爱因斯坦宣称,如同物质和电一样,光子也可能是粒子状的。
[1] 本书图表由莉莉·冯·贝耶尔(LiLi Von Bacyer)所绘
[2] Helge Kragh,“Max Planck:The Reluctant Revolutionary”,Physics World,December 1,2000,31-
35,http:www.math.lsa.umich,edu~krasnymath156-article-planck.pdf.[3] 频率的单位是每秒周期的个数,也被称为赫兹(hertz),简写为Hz。
[4] 由于频率的单位是周期个数每秒或者秒的逆,h乘以f之后就可以将秒消掉,最终量子e
的单位就是能量:焦耳。
[5] 1品脱=12夸脱(英)=1.365升。
[6] Phillip Frank,Einstein—His Life and Times(New York:Alfred A.Knopf,1947),71.第2节 光的粒子
我们不知道爱因斯坦是如何提出他激进而又影响深远的想法的,但
是他留下了许多线索。当被问到“思考是什么”的时候,他回答道,思考
并不起始于文字或者方程,而是“尽情想象”,这个过程或许会被我们称
为白日梦或神游,抑或是让自己头脑中的图像彼此交叠,如同万花筒中
的彩色玻璃碎片一样。即使这样,爱因斯坦继续说道,这也不是思考。
但是,如果在这个好玩的图像中,一些模式重复地蹦出来,这也许意味
着一个新的观念。进一步说,如果最终能够将这个观念表述成文字或者
是数学符号——找到了!——一个新的思想诞生了。
在1905年这个奇迹之年,爱因斯坦不仅用狭义相对论震惊了他的同
行,他也在探寻(Ponder)着光电效应的秘密(见图1.4)。当一束光照
射在某种特定的金属盘表面,它会将电子敲打出金属,将其释放出来。
既然电子是带负电的,它们飞离金属板将使金属板带正电。当仔细研究
这个效应的时候,它展现出两个让人感到疑惑的地方。如同期待的那
样,电子以假设的不同能量冒出来,然后在金属块附近跳跃着,速度减
慢并以无规律的方式跑出去。但是对于给定的单色光,似乎存在着最大
的电子能量——所有电子无法超越的能量极限。当提升光的强度,让金
属板完全被光照覆盖,使电子喷涌而出时,这样仍然不能提高电子的最
大速度或最高能量。是什么在抑制它们呢?
另一个疑点在于当不同的金属——当然也有不同的光——互相比较
时,光电效应会突然出现。对于每一种金属都存在着一个临界频率,低
于这个频率的时候,光电效应不会出现。换言之,当光的频率太低,即
光的颜色“太红”的时候,没有电子会被释放出来,不论照射光的强度是
多少。可为什么彩虹的红色一端的光无法将电子从金属中驱逐出去呢?图1.4
这两个观察到的现象——电子的最大能量和最小频率——在经典物
理中没法讲清楚。19世纪初光就被证实是一种波。随后,物理学家尝试
着用空间中以光速传播的快速振荡的电磁场去描述。想象一下,电子如
海滩上的鹅卵石,光则像海浪一样拍打在上面,将它们击出,散落在周
围。也许这就是爱因斯坦开始尝试构思的时候脑中浮现的画面,但是这
并不意味着对光电效应的详尽描述的合理性。在一定条件下,电子的速
度有上限。受到原子论成功的鼓舞,可以想象入射光事实上是由分立的
一团团的某种物体构成。这些物体不是原子也不是分子,因为我们知道
光子并不是由物质构成的。但是这个假设的单色光团的能量都是一样
的,并且一个团迎面去撞击一块鹅卵石,这块鹅卵石将会吸收这个团的
全部能量且不会更多(撞球球员知道,如果一个转动的球迎面撞上静止
的球,将会把自己的全部能量转给目标,并且不会更多)。在这一图景
中,如同观测到的一样,电子的能量将会存在一个最大值。
这时,爱因斯坦也许想起了5年前普朗克那有些别扭的论证,这也
使他不太情愿地采用物质以e =hf 能量包去释放光子的这个假设。尽管
爱因斯坦考虑的光电效应和普朗克考虑的发光物体的辐射曲线是不相干
的现象,但是它们有着内在相关性,即都与光的本质相关。只有爱因斯
坦发散思路所构建的那些图景才暗示着这两类实验,即一个是吸收光,另一个是释放光,也许揭示着一些共同模式。他最重要的一步就是将已经获得极大成功的关于物质和电的原子假设扩展到光,称它为团,或者
束,或者是一个量子,而现在这个光“原子”被称为光子,并且这是电子
之后被发现的第二个真正的基本粒子。这也为其他即将发现的基本粒子
树立了一个榜样,最近的一个例子就是希格斯粒子(Higgs particle)。
希格斯粒子被搜寻了半个世纪,最终在2012年被发现。
爱因斯坦将沙滩上鹅卵石被波浪击出的图景换成光源源不断地击打
陷在金属盘上的满满的近乎静止的电子上。偶尔地,一个光子撞击在电
子上,放弃它的能量e ,就像雪花融化在你的掌心这个过程一样。然后
电子匆忙地试图离开,在原子附近上下跳动,最终离开了它的监狱。它
以e 的能量逃离,在离开过程中会损失一定的能量,而问题就在这里,电子不会获得比e 更高的能量。增加入射光的强度能够增加被吸收的光
子数目,然而每个光子携带着相同的能量e ,对于每个受到影响的电子
来说,吸收的最大能量依旧不变,增加的仅仅是数量。这解开了第一个
谜。
第二个问题的解一定让爱因斯坦在第一次想到它的时候就振奋不
已。为什么存在一个“最红”的最小频率,即在这个频率下光电效应不会
发生?答案是金属携带正电的核子的吸引作用使电子被束缚在金属板
中,就像井里的青蛙一样,它们不能逃离金属板,除非光子给它们一个
推动作用。如果推动作用不够大,它们就只能待在板里。如果颜色太
红,入射光的光子能量将太低,而按照普朗克公式,每个光子的能量将
太微弱而无法提供所需的推力。每个金属都有个天然存在的最低频率,在这个频率之下,不论入射光多么明亮,也不会把电子击出金属板。
爱因斯坦关于光电效应的模型基于光子击打近似静止的电子这一图
景。关于这个模型的证明花费了将近10年的实验工作,不过最终获得的
结果是令人信服的:光是由粒子组成的。
相比而言,光是由波组成的实验性论证同样有说服力,也更简单。
这个观点第一次被验证是在1803年由托马斯·杨(Thomas Young,1773—1829)实现的,大约在普朗克和爱因斯坦的量子假设的一个世纪之
前。
使波明确区别于粒子的独一无二的特征在于,在特定的条件下,波
可以互相抵消,使什么都不剩下,这个技巧被称为破坏性干涉
(destructive interference )。而常识告诉我们,不论是白球、弹珠抑或
是其他常规粒子都不可能做到这种抵消。假设两个完全相同的波从不同
方向到达同一个点,相遇的时候它们会重叠,这种重叠被称为叠加
(superposition )(见图1.5),意味着在相同位置它们相加在一起,就
像重叠的摄影照片。如果两列波保持在这个点,恰好以完美的步调错
开,一列波的波峰恰好抵达另一列波的波谷,这两波相互抵消。这个因
为波发生破坏性干涉的暗点,如果你知道在哪看的话,就会发现这在自
然界很常见。海浪、声波、无线电波甚至是次声波或两个小孩舞动的跳
绳上的波,都能产生这个静止的点[如果这两列波同步,波峰遇到波
峰,波谷遇到波谷,则会彼此加强,这被称为有益干涉(constructive
interference )]。
图1.5
激光本身就是量子力学的产物,它的发现使观察光的破坏性干涉变
得简单。网上有许多关于“双缝干涉实验”自制的演示实验(见图1.6)。
其中有一个是将绝缘胶带粘在细线上做成双缝的形状,放在激光发射器
前面。用激光去照射双缝,在墙上会产生干涉图样
[1]。这两束光通过双缝之后,将会非常完美地同步。然而,对于墙上的每个点,光的来源
不同。既然从不同缝到这个点的距离有微小的不同(除了中间那条
线),光波的同步或者异步依赖于墙上的点的位置。你将看到的是墙上
的平行图案,要么是暗的,要么是亮的。
图1.6
简单说下这里为什么用缝,而不是用很小的开口(如小孔)作为光
源。为了使干涉更明显,这个小孔必须很小且足够靠近。在这个限制
下,小孔将无法使足够的光通过。但是如果适应细小的双缝,只要愿
意,你可以设计成你想要的任意长度,你将获得更多的光以及更好的成
像图样,即使这两个光源很小而且靠得很近。因此,这个实验通常是使
用缝隙而不是小孔去演示。
屏幕上亮线部分坐落在从双缝出来的光互相加强的部分,而暗线则
是相消部分,这也就证明了光是由波组成的(见图1.7)。
事实上,一旦你知道光是由波组成的,你可以在很多地方发现干涉
效应。举例而言,干涉使肥皂泡出现闪烁的颜色。肥皂泡的壁是由一层
薄薄的水层组成,当光线照射在肥皂泡壁上时,会在两个表面产生反
射。图1.7
内层反射的光束在通过水抵达外表面的时候会有延迟,穿出之后会
与外表面反射的光在步调上产生差异,步调错位的程度与水的厚度及光
的频率或者颜色有关。当两束光合在一起到达我们眼睛的时候,步调不
一致的将会彼此相消并从光谱中删去,恰好步调一致的会彼此加强。因
此,不同厚度的肥皂泡壁会喜爱不同的光,当泡泡扭曲、摇晃和畸变
时,这些颜色将会产生变化。自然以其内在极其艳丽的方式揭示了光的
波动性,几乎就像它向我们展示海面的波动性那样明显。
其他展示干涉的例子也很多。斜着去看CD光盘时,反射的光会产
生彩虹的颜色,蝴蝶的绚烂颜色,海贝中珍珠母的可爱光泽,雨中在柏
油马路上流淌的油泛着的微光,甚至孔雀尾的花样,这些都是自然界告
诉我们光是波的方式。但是它不情愿告诉我们,光也会表现得像弹丸倾
泻一样。一个模糊不清的现象(即光电效应)和爱因斯坦无与伦比的想
象力才揭示出这个奇妙的、被称为光的东西所隐藏的另一面。
因此,我们该怎么去看待光,它是空间中迅速传播的电磁波,还是
幽灵般的粒子束?[1] “Do it Yourself Double Slit Experiment(Young’s)—Easy At-HomeScience”,YouTube
video,http:www.youtube.comwatch?v=kKdaRJ3vAmA.第3节 波粒二象性
光子是奇怪的野兽。如果你打算重复双缝实验,并保留到达的光子
图像(就像用纸作为目标去保留由来复枪制造的弹洞),你可以注视着
图像的发展过程,并且同时观测双缝每一半的光的特性,即波和粒子的
双重属性。让光的亮度变弱,使其平均每分钟只释放一个光子。刚开
始,屏幕是黑的。然后一个点在某个地方出现了——“砰”的一声,一个
很小的孔出现了,意味着有一个光子到达了屏幕。“砰砰”声之间的间隔
是随机的:砰—停一下—砰砰砰—长暂停—砰砰—短暂停—砰砰—砰砰
砰砰,如此周而复始。在很长一段时间内,这些点看上去是随机散布在
屏幕上。但是,当成百上千的光子击打在屏幕上时,你会开始看到一个
图样:很有规律的间隔、条纹状图案平行于双缝(见图1.8)。如果你
等候足够长的时间,等到成千上万的光子落在屏幕上时,一个很明显的
双缝干涉特征条纹的图样就产生了。
图1.8
分立的粒子产生了这些点,尽管这些条纹为光是波这一论点提供了
无可辩驳的证据。或许你会饶有兴趣地耸肩,指出水波是由无数的H2O
分子组成的,那么为什么说到光具有类波和粒子性的时候会如此大惊小
怪呢?微妙之处在于时序。水波(像球迷在足球场玩起人浪一样)是由无数个单元组成,而每个单元和其他相邻的单元之间通过某种方式彼此
连接,所以才表现得整齐一致。但是从激光器射出的光子到达屏幕间隔
了很长时间,不可能存在某种联系和交流机会让它们去调整自己的位
置。它们可以在抵达间隔数小时而不是几分钟,而图样仍旧一样。这个
过程就像上万盲人和聋子观众在不彼此接触的情况下玩人浪。这就像魔
术一样,让人感到不可思议。
如果20世纪早期的物理学家对光子的波粒二象性感到不可思议,很
快他们会更加震惊。从1923年开始,他们逐渐意识到波可以表现得像粒
子一样,反过来也是成立的:电子一直以来被认为是粒子,同样能表现
得像波一样。这个令人震惊的结论,以极高的精度在类似于双缝的试验
中得到了证明。激光被替换成电子流,束流强度可以像激光一样调整,并且这个双缝要远比自制的光的双缝干涉实验要小且距离更近。替换空
白的墙或者摄影胶片的是一个荧光屏幕,这个屏幕会在电子撞击的时候
闪光。可实验结果几乎一模一样:点以随机时间间隔出现并且位置飘忽
不定,但是最终慢慢地变成了一个完美的平行干涉条纹(请在第五节阅
读更多相关内容)。
历史总是十分巧合和讽刺,波粒二象性也巧妙地体现在英国的一对
父子物理学家身上,这两个人帮助奠定了现在所知的量子理论的基础。
在1906年,J.J.汤姆森(J.J.Thomson,1856—1940),当时的物理实验
大师之一,通过使用电场记录电子类似于高尔夫球在地球引力场中路径
一样的抛物线轨迹,证明了电子是一种粒子,并因此获得了诺贝尔奖。
31年之后,他的儿子G.P.汤姆森(G.P.Thomson,1892—1975),跟随
他父亲的脚步,通过展示电子的破坏性干涉从而证明了电子是波,因此
也获得了诺贝尔奖。
这对父子中的父亲,也是位优雅的作家。他总结了这个困
境:“(物理中波粒二象性这个观点)就像老虎和鲨鱼之间的争斗一
样:每一个在自己的领域都拥有至高无上的霸权,但是在对方的领地却是无能的。”想象一下,光子或者电子作为一种粒子而言,都无法解释
双缝干涉。当把它们当作一种波时,则无法解释光电效应。波的理论和
粒子的理论似乎无法兼容。
J.J.汤姆森话中提到的这两个理论,如同鲨鱼和老虎一样从根本上
就是不同的,对应着光子和电子在不同的环境中的状态。这种解释并不
能使急切寻找真理的我们得到满足。物理学的目标不仅仅是讲述关于我
们这个物质宇宙中每个物体和事件令人信服的故事,更是去制造一个单
独的史诗般的作品,一个描述我们所在自然界的一致性的理论。没有谁
比爱因斯坦对寻找统一理论更有激情,而且他在鲨鱼和老虎之间的激烈
竞争中已经独领风骚。早在1909年,即提出光量子之后4年,量子力学
诞生前6年,他在德国物理学家的一次会议上在报告中预测:“我相信,在下一个理论物理发展的时期,将会有一个新的关于光的理论,这个理
论是波和粒子理论的融合。”他很明确地知道需要什么,即使他并不完
全满意所得到的解答。
波粒二象性的麻烦也是显而易见的。波和粒子是我们从日常的、宏
观的牛顿世界中获得的不同分类,这对于原子领域是不够的。光子并不
像海波或者子弹,电子也不是。它们和日常的波和粒子在一些特点上具
有共同之处,可并不是每一个特征都是一样的。那么它们该是怎样的
呢?我们无法如《爱丽丝梦游仙境》中的爱丽丝那样将自己缩小到原子
的尺度,然后自己去看基本粒子在其所处的环境中的行为是怎样的。我
们所能做的,就是用我们的想象力帮助我们去画出一幅与人类尺度的实
验室中所观察到的现象一致的图像。
为了调和不相容的波和粒子的类别,“波粒”(wavicle )这个术语曾
被建议来描述电子,但不幸的是,这个丑陋而且非正式的词从来都没有
流行起来。我的朋友罗尔夫·温特(Rolf Winter)受J.J.汤姆森用动物做
类比的鼓舞,更加生动地把电子比作鸭嘴兽。18世纪时,当探险者第一
次把鸭嘴兽从澳大利亚带到欧洲时,大学里知识渊博的博物学家宣称这种动物是伪造的,只不过是把其他动物的身体拼凑在一起。“爬行类动
物不会哺乳。”“同时是哺乳类和爬行类的动物是不存在的,因此它不过
是一个恶作剧。”他们信誓旦旦地说道。然而,他们所创造的分类是通
过自身有限的观察所得到的,这最终被证明是不足以描述地球生物的丰
富多样。同样地,光子和电子是可以表现为波的粒子以及可以表现为粒
子的波。就像鸭嘴兽一样,他们忽略了这个分类是从不恰当的前例得到
的。
为了继续向前发展,而不是停留在发明无用的诸如“波粒”这样的新
词以及将它和外来的生物做比较,则需要更激进的方法。1909年,爱因
斯坦倡议波和粒子的理论融合并没有得到响应,直到1925年量子力学诞
生。然而,量子力学在它诞生之前很久就已经冲击着物理世界。
1913年,丹麦物理学家尼尔斯·玻尔(Niels Bohr,1885—1962)构
建了第一个成功的原子内部模型。遵照物理学家从简单开始的习惯,玻
尔将他的注意力集中在氢上,氢是元素周期表上第一个也是最轻的元
素。他大胆地将氢原子系统类比成太阳系,并把氢原子描述成一个孤独
的电子如同地球绕太阳那样围绕中心核子转动,且只在特定分立的轨
道,即半径是固定的若干普朗克常量h 的数倍。当电子向上(或向下)
跳跃一个级别时,相应地会有光子被吸收(或释放),而光子的能量由
普朗克—爱因斯坦方程e =hf 给定。这个图像很快被逐步改善成包含了
椭圆形和圆形轨道,也遵循相对论,并可以用来描述比氢原子更加复杂
的原子。最终,著名的原子“玻尔模型”成为科学中最常见的漫画,即那
幅无处不在的一个点在中间、三个椭圆形代表三个电子轨迹的图片(见
图1.9)。据推测,那幅图描述的是元素周期表中的第三个元素——
锂。图1.9
这个小图标产生了无数的变体,已经被广泛地认为代表着原子,而
且被改编用于高科技公司、政府机构以及消费品的标志。它在情景喜剧
《生活大爆炸》(The Big Bang Theory )不同场景的荧幕上飞快闪过,并且在全球范围内,它意味着力量。因为这个标志所传达的信息如此简
单且令人信服,在高中教学中也占据着优势。对大部分普通人来说,它
代表着他们对原子结构的理解。
不幸的是,本质上它是错误的。
1919年,刚刚引入这个理论6年之后,玻尔被迫否认了这个理论,因为它歪曲了之前盛传的对原子内部电子行为的理解。玻尔模型将氢原
子内部单电子的轨迹描述为绕核子(已知为质子)的轨道,最终得到的
氢原子结构就如同煎饼一样平。但是我们知道的是,在观察它与其他原
子相互作用的时候,从外部来看,它就像是一个模糊的棉花球而不是煎
饼,至少在常态、静态的时候是这样的。
更糟糕的是,这个原子图暗示着电子在远离核子的地方保持在特定轨道上一直运动,这个轨道半径被称为玻尔半径(Bohr Radius )。但
是实验显示,当探测原子的时候,电子不仅仅在原子表面被探测到,在
这个棉花球的内部也能探测到。
玻尔模型最过分且让人不可原谅的瑕疵远远大于技术上的缺陷。通
过假设急剧又确定的轨迹,这个模型忽略了波粒二象性,而更青睐于它
的粒子本性。玻尔模型也可以说是一种倒退,退回到了牛顿物理:其中
一个粒子具有精确且连续的轨迹,并且在轨迹每一点都具有定义明确的
位置和确定的速度。以行星轨道的方式描述原子中电子的行为,在一个
世纪前就已经从物理学词典中删除了。
玻尔模型能够让人在头脑中产生生动的图像,它占据了大众对科学
的想象,甚至到了一种令人担忧的程度。它是阻碍发展的一个历史遗
址,它暗示着原子物理学在100年间没有任何改变。没有其他的基础科
学会给人留下这种印象:宇宙学不是这样,它产生了一系列令人窒息的
发现,如宇宙加速膨胀和谜一样的暗物质(dark matter )以及暗能量
(dark energy );天文学也不是这样,它每天都会得到遥远彩色发光物
体的炫目图片;生物学也并非如此,我们对大脑的结构、人类基因的微
妙之处以及令人震惊的演化结果有日趋增长的理解。那个广泛存在的原
子图标是如此过时,就像用马或者马车的画像作为停车场的标志或者是
用莱特兄弟的卡通图作为到机场的指路牌一样。
尽管玻尔模型之前是量子力学发展中重要的一步,但是它却早早不
适用了。尽管波粒二象性会使原子真实的图像变得更复杂,但是我认为
应该尝试着把玻尔模型老图标更新成更符合21世纪的新图标。也许在
1925年诞生的量子力学百年诞辰庆祝之际,会有人对这个图标公开质
疑。第4节 波函数
物理学家的目标是解释非生命世界的运作方式。首先,哲学家按照
如下方式描述一个客观物体:划过夜空的行星、冰雪的形成、七弦琴的
声音。当关注不能被直接看到或者不那么容易测量的时候,物理学家创
造了机械模型替代对客观事物的直观描述。希腊原子论用看不到的粒子
穿过虚空描述连续物质,马克斯·普朗克看到了发热气球中数不尽的小
振子,而尼尔斯·玻尔在他思考氢原子的时候把它想象成微型的太阳
系。
最终,机械模型失败了。它们被适时地抛弃了,取而代之的是更加
抽象的数学模型。相比它们的先行者,数学模型如同斯巴达一般冷峻。
它们由一系列方程和公式组成,不含修饰、色彩、可见的细节——没有
机械模型那样丰富的外观(谁不为玩偶之家、模型船和模型火车着
迷),但是数学模型之所以缺少吸引力,只不过是为了补偿它的一般性
和预测能力。牛顿广泛适用的引力定律则是数个世纪以来对自然现象的
纯数学描述最具说服力的例子
[1]
,它阻止了一代代专业和业余的物理
学家的无效努力。他们曾试图将引力产生描述为由不可见粒子的机械推
动和一些宇宙的流体的旋涡而引起的。然而,那些无穷无尽的天体和地
球的信息都可以被压缩在8个符号之中,知道如何解读的人就能发掘其
中的信息。
到发展原子理论时,我们渐渐发现传统的分类是远远不够的。原子
外壳中电子的运行轨道和速度似乎是无法获得的,原子释放光波看上去
像粒子,电子表现得像波。原子物理颠覆了原来的观念。
一小部分有杰出创造才能的物理学家意识到没有哪个机械模型能够
令人信服地揭示波粒二象性,他们转而研究数学模型,最终引领了量子革命。他们志在用数学语言描述原子物理实验所展现出来的奇怪事实,而不是美丽如画般地描述潜在的现实。这是大胆的一步,他们的许多同
行很难理解。但是量子现象的数学模型却硕果累累。
重大飞跃在于将客体和它的描述分离开。“我们先不去看电子本
身。”量子力学的创造者提醒道。偶尔他们会详尽地说,而更多的时候
则是含蓄地表达出来。“甚至不要试图去想象一个设备表现得像电子,相反,让我们先去寻找一系列数学方程,这些方程可以预测实验室中电
子的行为。数学并不会在意事物是否看上去像波或是粒子还是鸭嘴
兽。”令他们喜悦的是,他们做到了。
做到这个技巧的方案是一个公式,波函数(wavefunction ,一开始
是短语wave function ,后来也用过连字符连接的wave-function ,最终标
称一个合成词wavefunction ,这模仿了原始的德语构造方式)。它的创
造者是埃尔温·薛定谔(Erwin Schr?dinger,1887—1961)。波函数不仅
揭示了特定量子系统的属性,也包含了在这个系统上进行特定实验时的
必要细节。因此,波函数不只是有一个,对于每个独特的实验室设定,都有一个特定的波函数。在大多数情况下,用图像表示的波函数一点都
不像波,只有它的名字还在提醒我们,量子系统共有的一个重要的性质
是叠加以及建设性或者破坏性干涉的可能性,即两列波占据同一个点,甚至可能彼此加强或者消除。
通常来说,波函数的数学形式相当复杂——远比方程式E =mc
2 或e
=hf 复杂得多。因此,在这里我不讨论任何实际系统波函数的例子。但
是这并不意味着我们不谈论它们,这就如同你在享受音乐的时候并不需
要真正理解音乐。
玻尔将氢原子类比成微缩的太阳系,比这更大胆的类比启发了波函
数的构建。对经典物理学家来说,原子物理最令人费解的问题是原子能
级的分立问题。不像地球卫星能够绕地球任意高度转动,且可以携带任意能量,束缚在原子中的电子只有确定的、分立的能量。这种限制来自
哪里?
连续性中出现(就像魔术意义上)分立值最好的例子就是音乐了。
自远古时代以来,音乐设备,如七弦琴、鼓、长笛等,就能产生独立的
基本音调,还有泛音。把波限制在一个有约束的空间,如固定长度的
弦、圆形的鼓面、笛子中空的内部,你或许以为它们只会产生噪声,然
而产生的却是纯音高。音高对应着带音符的声波的频率,而音乐则由组
合不同分立频率得到。问题在于,原子限制电子,笛子限制振动的空
气,除此之外两者没有任何相似之处,从这个角度来看,音乐设备中众
所周知的频率分立如何帮助我们解释原子中神秘的能级分立?
答案当然已包含在量子力学第一个尝试性的假设中,即由普朗克—
爱因斯坦方程e=hf 给出的能量和频率之间的基本联系。
受众所周知的音乐设备所产生的声波公式启发,通过e=hf ,量子力
学创造者所面临的挑战是寻找具有分立频率的波的数学表达式,而这个
表达式又和原子能级匹配。这个表达式也许不是用来描述原子本身,但
是能够预测原子能级的梯度。埃尔温·薛定谔成功找到了建立一个数学
方程的一般步骤,反过来,这个方程的解就是他著名的波函数。
量子理论可被认为是一门找波函数并从中得到可测量结果预测的科
学。随着时间推移,计算上繁杂的技巧也在与时俱进,一开始借助计算
尺,现在则利用计算机。用这种方式研究的系统,从单个粒子和原子慢
慢演变到大团材料,再到星体内部,甚至到了整个宇宙。到目前为止,量子力学成功地经受住了每一个实验测试。
第一个用量子力学方式去处理的系统不是原子,甚至都不是电子,而是开创量子力学的装置——谐振子。它的数学描述仅仅涉及它的质量
和不变的频率(使振子回复到它的平衡位置的振动强度可以由这两个量
得到,所以不需要专门把它的形式包含进去)。不出所料,量子力学的标志普朗克常量h 在这个计算过程中扮演着重要角色。它如同比例尺一
样在图片边缘显示出来,为照片设定了度量,就像米尺为考古学家新挖
开的地沟照片设置了刻度。
作为理论上的小白鼠,谐振子非常简单,这是它的优势,而它的劣
势在于,在20世纪并不存在足够小的、真实的、能用来展示量子力学效
应的质量——弹簧谐振子
[2]。最多这只能作为进行更复杂项目前的一
个热身活动,诸如对氢原子的描述,得到的结果和实验的测量结果一
致。尽管这样,即使是机械谐振子也可以揭示经典牛顿力学和量子力学
间非同寻常的差别。普朗克在绝望之际猜测谐振子能量为e=hf 倍数,这
被证实几乎是正确的,但是并不完全。令人惊讶的是,限定(allowed)
的能量梯度并非从最低能级开始,相反,最低能级是一个能量量子的一
半,限定的能量是它的奇数倍e 2,3e 2,5e 2……普朗克非常幸运,因为不同能级间的差仍然是e 的倍数,这个差决定了一个特定的谐振子
所能吸收或者释放的能量,而这才是他真正需要假设的地方。一个量子
谐振子不能辐射或吸收46.7hf 能量,就如同杂货铺老板收到或者找零的
现金不能是46.7美分。这是无法做到的!如果你试图吸干一个谐振子的
所有能量,使它停下来,那么你注定会失败。就像一个极度活跃的咿呀
学语的小孩,你永远无法让他停止手舞足蹈。记住,在剥夺谐振子的所
有能量之后,由于h 是如此之小,因此剩余的震颤很难被检测到。尽管
如此,实验仍证实了量子力学的这个特殊的预测。
除了能量的量子化,波函数意味着叠加。根据经典物理学理论,物
体的位置和速度是被精确定义的。与此相反,谐振子或任何物质的粒子
的波函数所包含的位置和速度的值,可以在一定范围内同时以不同的值
分布,即叠加。注意,我并没有说位置和速度可以有分布。正确的表述
应该是:包含在波函数中的位置和速度可以有分布。这是很重要的一个
区别,随后我将更详细地讨论这个。
波函数有点像地图——最理想的地图,它包含了量子系统所有可以说的东西。在这里需要提醒的是,普通地图所包含的信息并不一定会被
完全展示在一张纸的图画或者地球仪上。举个例子说,道路地图册往往
包含了表单,其中列出了城市之间的距离以及驾车时间。为了简化问
题,设想一下,表单中的距离不是沿着高速路的真实里程,而是两个地
点之间的直线距离,就像鸟飞行的路线。想象一下,这个表的扩展版本
包含美国数以千计小镇的数据。原则上来说,通过这个表单是可以重建
整个传统地图的。下面是如何去重建:圣路易斯(St.Louis)在地图页
中间,纽约在右手边的边缘处,查阅电子表单中两地的距离。现在你就
知道了比例:在你的地图上,一英寸代表多少英里。然后,从表单中,找到这两个城市到迈阿密的距离并把它转换成英寸。既然三角形三边能
够确定一个三角形,现在你就知道了迈阿密的位置。继续这样的步骤,就可以得到整个地图了(见图1.10)。天文学家用这种方法记录地图,即把数以百万计的恒星的坐标列在一个很大的目录中而不是标在图标或
球体上。地图、表单和目录可被用于记录同一个数据集,尽管它们看上
去是如此不同,可对很多目的来说,它们是等价的。同样地,波函数所
包含的信息可以用公式、表单、一系列数字或者一张图去展示。
图1.10第一个关于谐振子的量子力学描述,事实上是用表单表达的,它在
数学上被称为矩阵(matrix )。这些矩阵随后很快被证明在数学上和波
函数等价。既然后者比前者更容易去想象,在本书大多数情况下,我将
使用波函数。
当试图解决量子力学的疑难之时,人们常常忘记了物体和它表示之
间的差别,这是大部分人甚至是一些专业的物理学家都会掉入的陷阱。
哲学家阿尔弗雷德·柯日布斯基(Alfred Korzybski)明确地表达了两者
之间的显著区别,他创造了一个格言“地图非疆域”(The map is not
territory.)。这个短语很精练地提醒了一个事实,那就是:一个对客体
的描述并不是客体本身。现实并不是和描述现实的模型一样,就
像“house ”这个单词不是砖和泥灰做的房子。柯日布斯基警示了把地图
和疆域混为一体的恶作剧,他的言辞引起了对量子力学的奇怪之处的一
些质疑,质疑在于这种奇怪之处并不是自然本身而是来源于波函数。是
否只是地图怪异而非疆域诡异?
当我们是小孩的时候,我们学着通过探索街道地图和它所代表的沥
青混凝土的关系,以此学着去读地图。当我们查阅静态的二维图像并试
图把它转换成我们周围庞大混乱的三维世界时,或者相反,当我们看周
围复杂现实世界的简单示意性的草图时,我们脑中闪过什么?比较疆域
和地图的这个过程是如此艰难,以致一些人从没能真正理解。如果再把
运动包含进去,如车载GPS(全球定位系统)屏幕,会让一些人更加疑
惑。类似的隔阂阻碍了人们对量子力学的理解。在量子的世界,薛定谔
的波函数就如同一个理论家笔记本中所构建的演化地图。假如它像地
图,那么它到底要描述什么?又如何将它联系到现实的原子世界?
[1] F=GmMr
2 ,其中F表示引力的强度,G是引力常数,m和M指相互吸引的两个物体的质
量,r是两者之间的距离。
[2] 一个和人的头发丝宽度大小的微小的音叉被《科学》杂志评选为“2010年度科学重大突
破”,它能够展现出量子行为。可参考http:en.wikipedia.orgwikiQuantum_machine。第5节 “最优美的物理学实验”
我们通常用波函数来描述量子系统中包含的信息。量子谐振子的波
函数预示了该系统只能储存离散的能量,这与我们熟悉的经典系统不
同,例如,一个音叉的能量是任意的,这与敲击它的力度有关。同样,氢原子的波函数暗示着它的能量也是分散的,只不过能级图比谐振子更
加复杂
[1]。
对于量子系统,波函数不但包含能级的信息,也预言了其他不计其
数的实验结果。给定任意实验装置和相关说明,原则上用量子力学精美
的数学语言可以构造出该系统的波函数,并且计算出相应的测量或观测
结果。这里我将避开这些技术问题,而是通过讨论电子的波粒二象性进
而解释波函数的意义。让我们拭目以待,看看波函数是如何处理这个谜
题的。
下面我们将比较物理学家是如何描述子弹和电子这两个不同的抛射
物的。
我们先讨论子弹。为了简单起见,忽略重力和空气阻力的影响。一
旦子弹离开枪管将不再受任何力,根据牛顿运动定律,它将一直保持直
线匀速运动,直到碰到靶子——我们暂且假设靶子是一块木头
[2]。子
弹突然受到制动力,同样根据运动定律,它会减速直至停止。停止之
后,由于各个方向子弹都承受同样的挤压,因此它不再受力,保持静
止。
射手和他的装备将决定射击的精准度。据说,传奇的神枪手安妮·
欧克丽(Annie Oakley)能够精准击中抛向空中的硬币。而如今,如果
利用那些精心制作但价格离谱的装备,包括激光、透镜组和计算机等,一些业余的选手都可以轻松击败她。在经典物理学中,枪法的精准度没
有任何限制。设想如果在开枪时子弹的速度和位置是限定在特定范围内
的,那么它最终撞击的点也会有相应的限制。原则上我们可以无限精准
地射击,虽然这并不现实。所以,理论上如果安妮拥有足够好的枪,足
够敏锐的视力,并且手完全保持静止,那么她就可以击中硬币上任意一
点。
下面我们来说说电子。电子通常是从一个被称为电子枪的设备中发
射出来。过去在美国家庭中这种“武器”比猎枪更为常见。那些老式的电
视机中都有电子枪,它们藏在电子成像管的末端,而现在家庭中常用的
平板电视则不再包含这样的设备。这里我们考虑电子从电子枪发射出
来,然后终止在屏幕上并且留下可见点,和刚才一样,忽略电子在中间
运动过程中受的力。
量子物理学家不能像对待子弹一样追踪电子的轨迹,而只能计算它
的波函数。为了得到波函数,他需要知道电子枪的几何形状以及电子离
开枪口时的速度。和谐振子与原子中的电子不同,该波函数的示意图实
际上与电子枪到屏幕之间的波类似。像石头在水中激起的涟漪一样,波
函数从枪口向屏幕扩散开来。而当电子碰到屏幕时,奇迹出现了。之前
如水波一样的波函数突然莫名其妙地塌陷到屏幕的某个点上。在碰撞之
前,它还在空间中向四面八方散开。而碰撞之后,波函数在空间各处的
大小则几乎为零,除了它最终到达的那个点。
这种现象我们称之为波函数塌缩,它告诉我们波函数的意义,却如
此离奇。我们会在下一节中讨论这一解释的缺点。
我们不断地发射电子枪,最终会在屏幕上绘出一个图案。这个图案
由每次碰撞的点组成,它是理解波函数意义的重要线索。每次碰撞的点
在图案中是随机分布的。这里随机可理解为不可预测的、没有规律的。
而随机这个词则体现了之前提到的经典力学和量子力学之间最关键的差
别。当然,安妮·欧克丽或许并不觉得太惊讶。如果考虑到空气的影
响,枪的某些不确定的特性,甚至她自身脉搏的跳动,那么她击中硬币
上的点的位置也将是随机分布的。她或许会想:“我不可能比这更精准
了。”然而,经典物理学家则坚持认为,假如给定各种因素的细节,子
弹的路径是可以预测的,并且可以达到任何想要的精度。在经典物理
中,这只是统计的随机性,往往源于我们对某些微小的细节的忽略或者
无知。我称之为安妮·欧克丽随机性。原则上经典力学并没有随机性。
例如,硬币抛掷,其结果通常被认为是完全随机的,但是利用力学,每
次的结果也是可以被预测的。安妮·欧克丽随机性是可以通过适当的方
式消除的,虽然不能完全根除,但是可以无限接近你想要的精度。
与之截然不同,电子的随机性则是不可避免的。即使我们把电子枪
的尺寸和电子的速度都控制在足够的精度范围内,波函数传播仍有不可
避免的随机性。在创立量子力学的早期,物理学家很难接受这种量子随
机性。其中爱因斯坦一直没有接受这种观念,因为这与他辉煌且硕果累
累的一生中所理解的物理完全不同。他察觉到其中的矛盾。虽然他对量
子力学做出了非常重要的贡献,而且量子力学以惊人的速度获得了成
功,但是他相信自己敏锐的物理直觉并不会欺骗他,因此他毫不忌讳地
表达出自己对这个刚出生的量子理论的怀疑。他机智地提出各种异议,有些在他逝世多年之后才被证明是错的。爱因斯坦错了,量子随机性确
实存在,但是一批爱因斯坦最忠诚的拥护者仍希望最终可以证明他是正
确的。
量子随机性(也被称为本质的或者固有的随机性)撼动了自亚里士
多德以来的物理学的一块基石——因果律。任何一种现象或者事物都必
然有其原因。虽然我们很难确定相应的起因,但通常假设它必然存在。
如果安妮·欧克丽总是射中硬币上的字母L 而不是Y ,可以想象,经过足
够多的努力我们肯定能够得到其中的原因。另外,电子由于遵循量子法
则,则否定了这种可能性。对于一个像爱因斯坦那样的经典物理学家来
说,抛弃因果律就等同于破坏了整个物理学。后面我们会讨论量子贝叶斯如何将物理学置于一个新的、更有弹性的基础之上,并使之能与固有
的随机性自洽。
电子枪绘出的图案为理解波函数的意义指明了方向。如果碰撞的点
是完全无法预测的,那么这些不规则的点会覆盖整个屏幕,对电子的路
径我们便一无所知。但是我们确实对此知道一些——事实上知道很多。
波函数精准描绘出圆形的、对称的形状,而且点集中在中心,并且点的
密度随着离中心的距离越大而递减。因此,电子枪给我们提供了一个随
机却内含部分信息的例子(见图1.10)。
科学现象往往遵循着类似的规则。通常一些现象很少能完全展示出
所包含的信息或者完全不包含任何信息。例如,误差总是和测量形影相
随。即使在生活中,绝对的确定性或者完全的随机性也很少出现,天气
预报或者交通模式就是最好的例子。这两个例子的共同特点就是我们可
以给出很多预测却不能百分之百的准确。数学中的概率便是用来处理类
似情况的。概率这个概念在量子力学中与普朗克常数h 同等重要。但是
引入这个概念的结果则是十分微妙的。图1.11
电子枪绘出的图案暗示着波函数并不是用来描述电子本身而是反映
概率的。尤其是电子即将碰撞屏幕时的波函数决定了电子最终到达屏幕
上任意点的概率。
通过概率来解释波函数是量子力学带给物理学的重大改变
[3]。
在第3节我们讨论了光的双缝干涉实验,实验结果向我们展示了随
机和规则是如何交融在一起的。两个分离的源发射出的光波干涉之后形
成条纹状的图案,而每个光子则被记录为那些随机分散在照片底板上的
点。
1965年我刚刚开始教物理,同年,理查德·费曼(Richard
Feynman)出版了他著名的教科书《费曼物理学讲义》。在书中他详细
阐述了电子双缝干涉的理想实验进而讨论量子力学。设想左边是一个电
子枪,中间是两个极小的双缝,而右边放置着荧光屏,当电子击中荧光屏时会产生一个斑点。2002年,该实验被一个英国的杂志《物理世界》
评为“最优美的物理学实验”。
在费曼的书出版之前,物理学家就已经做过该实验的简化版。但是
直到2013年,技术上才足够成熟,费曼在半个世纪之前描述过的实验才
能真正付诸实践。除了创造和探测单个电子的困难之外,另一个让人却
步的现实阻碍就是双缝的尺度。用现在的说法,这些缝是纳米(nm)
量级的(1nm=10-9 m=十亿分之一米=百万分之一毫米),这么一个精密
的工程是不可能在家中通过电线和绝缘胶带完成的。看到那些随机出现
的点逐渐绘出条纹状的图案,我们犹如正在看量子力学是如何工作的,这一定是一种让人着迷的体验
[4]。
除了演示波粒二象性和量子随机性,这个实验也毫无疑问地展示了
波函数的传播。每一个细缝仅有60纳米左右的宽度。这个数字说明我们
可以忽略电子在发射点横向的具体位置,而屏幕上显示的条纹的宽度大
概有300毫米。为了让波函数的两部分发生干涉,必须把双缝到屏幕之
间的宽度增加5000倍。这显然说明了波函数扩散得非常开。
仔细思考这个实验,我们很容易误入歧途!思考一束光从激光发射
器到双缝,向前传播、干涉,最终产生条纹图案。当我们把光换成电子
之后,似乎就变得不那么自然。这是因为我们知道电子只能一个接一个
地通过双缝。更进一步,如果考虑在2013年那个实验中将双缝板和屏幕
移开,将电子枪指向窗户,那么电子将会像蹒跚学步的小鸭子一样排成
一排向前传播,但是在传播大约2000千米之后,它们就会分离开来。每
一个电子都独立传播。双缝只是将波函数而不是电子本身分成两个可干
涉的部分。而对于每个电子来说,在没有其他电子干扰的情况下,却莫
名其妙地设法避免碰撞到那些条纹的暗区,就像有一股神秘的力量在操
纵它一样。
做双缝干涉的那个实验组基于他们的测量仪器、相关误差等仔细地计算了电子的波函数。实际的运算要比费曼书中考虑的理想化计算要复
杂、冗长。测量成千上万个电子在屏幕上的位置之后,他们将结果与量
子力学的预言比较。屏幕上展示的正是前面我们说到的条纹图案而不是
随机的点。实验组最后简洁地评论道:“我们看到的结果正是量子力学
所预言的。”他们艰辛的努力是值得的。
[1] 马克斯·普朗克得到的谐振子的能级稍微有点差别,与之不同,尼尔斯·玻尔用他自己的
力学模型得到的氢原子能级是完全正确的,大约12年之后才有波函数的概念。
[2] F=ma,其中m是物体的质量,a是它的加速度,F是引起物体加速的净外力的大小。
[3] 数学上描述波通常包括正值和负值,分别代表波的高度在x轴的上方或者下方。但是概
率却不能为负值:它们是0和1之间的实数。更糟糕的是波函数通常包含虚数,如-1的根号。因
此波函数的数值不能等价于概率。正确的数学描述是这样的:“概率密度等于波函数和它的复数
共轭相乘。”我会简化为一些惯用语,例如,“波函数得出概率”。
[4] 关于这个实验可参考《费曼双缝干涉实验取得重大突破》(“Feynman’s Double-Slit
Experiment Gets a Make over”)这篇文章,Physicsworld.com,March 14,2013,其中还有相关的视
频,参考网址:http:physicsworld.comcwsarticlenews2013mar14feynmans-double-slit-
experiment-gets-a-makeover。第6节 见证奇迹的时刻
如果见证单独的电子逐渐在屏幕上绘出条纹图案是一段让你不安的
经历,那么将其解释为波函数塌缩会让你更加困惑。为了帮助理解,我
们仍将电子枪类比于一杆真正的枪。子弹从枪膛发射出之后以不变的速
度运动,最终击中目标并且停下来。同样地,电子的波函数也根据量子
力学的规则向前传播,最终突然改变它的特性转变为屏幕上的一个斑
点。虽然这两种情况有相似的地方,但是它们的不同之处也是显著的,只是现在还不能明显看出来。
子弹在任意时刻都是严格遵循牛顿运动定律的。
而电子则表现得有些反叛。在电子碰撞到屏幕之前,它的波函数随
时间演化,像平静湖面上的涟漪一样扩散。它的演化由量子力学的运动
定律决定。相应地,在某特定点找到电子的概率也在空间中迅速扩展
开。但是,当电子在屏幕上停止的时候,描述它的波函数也会立刻、彻
底地改变它的特性。波函数塌缩了,同时概率也转变为(几乎完全)确
定的信息——电子的位置。塌缩的过程没有任何规则、规律。它确实发
生了。波函数塌缩的原因及方式自从90年前量子力学诞生开始就一直是
物理学家争论的话题。
量子力学的创造者在试图解决波粒二象性的谜题时,被迫采取折中
的方式。通过引入波函数,同时将它与概率联系到一起,他们成功地把
波动行为和粒子行为统一起来,但是他们不得不为此付出代价。他们必
须要放弃一个从牛顿到爱因斯坦一直根植于经典物理中的信念,即任何
物质的粒子都遵循同样的运动定律。事实证明,一个电子的波函数并不
服从子弹所遵循的运动定律。相反,波函数遵守下面两个不同的定律:(1)只要电子离开电子枪并且没有被观察到,那么它的波函数将
是光滑的、连续的,且是可以被预测的。它就像飞行中的子弹或者湖面
上的涟漪一样遵循着特定的数学方程演化。
(2)当电子在屏幕上留下斑点时,这就暴露了它的行踪,那么波
函数将立刻“塌缩”到一个新的、集中在碰撞点附近更紧凑的形式。
图1.12
无与伦比的科学漫画家西德尼·哈里斯(Sidney Harris)
[1]
在他的
卡通画“奇迹”中恰巧准确地描述了类似的情况。我倾向于想象着图中两
个物理学家正在讨论量子力学。波函数的塌缩不仅是空间上“塌陷”到有限区域,而且更一般地指可
能性到确定性的转化。不仅是位置,就连能量、速度、运动方向以及其
他量子粒子的属性都是概率性的,而且随着波函数的传播而变化,直到
我们做了测量之后,相应的量才会固定在特定的值。你要知道,在经典
物理中这些物理量是确定且唯一的。量子力学中可以找到很多例子并不
是这样。例如,电线中描述电流的波函数可以在向前的同时也向后流;
一个分子可以同时有不同的几何结构;放射性粒子可以同时地衰变和稳
定。我们或许会问,在这些可能的状态中,它们到底处在什么状态?实
际上,只有我们问了并且知道了这个问题的答案之后,它们才真正处在
某个特定的状态。
科学中并不应当存在奇迹。然而,偶尔有奇迹试图渗透到科学思维
中,真的就那么奇怪吗?毕竟世界呈现给我们如此之多的未解之谜。只
是聪明的人们并不称之为奇迹。牛顿的万有引力定律就是一个极好的例
子。
设想你手中拿着一个苹果,然后松开手,苹果就会落向地面。为什
么会如此?它留在原处不动不是更自然吗?如果你是一个飘浮在外太空
的宇航员,那么苹果确实会如此——悬浮在你面前。但是在地球上,它
却会下落。
牛顿解释道,这是由于地球在施加一种神秘的力,他称之为引力,这种力会吸引苹果并且将它不可逆转地拽向地面。这些看不到的触手是
什么?它们是真实的还是我们想象的?它们由什么组成?我们又能否操
控它,使它中断?如何阐明它们的本质?
通过推广他的定律,牛顿化解了这些谜题,他声称包括苹果、地球
等在内的所有实物之间都会相互施加吸引力。正是这些力使月球保持在
它的轨道,使地球围绕着太阳转动,使你我不至于飘到外太空。这被称
之为万有引力,它是超距作用最好的例子。但是超距作用是完全不合理的。生活常识告诉我们,直接的接触才
产生力。想要移动一个椅子,你必须要接触它,不管是直接用你的手,还是间接用棍子或者绳子。棒球在接触到球棒时才会改变运动方向,声
音和热的传播也是通过分子振动附近的分子,然后将运动形式链式传递
下去。光子携带着光或者无线电波从发射源到接收器。微观上看,即使
像前面提到的推动椅子产生的接触力,最终都可以解释为电磁相互作
用,通过点对其附近的点的扰动传播。而超距作用却与这种普遍存在的
现象不一致。这只是给奇迹披上了“自然定律”的外衣。
假如超距作用存在,考虑下你自己对宇宙的影响吧。根据牛顿的理
论,当你向前移动一步时,宇宙间任何的粒子,地球上的任何人,每一
个行星和恒星,不管它们离你多远,都会瞬时感受到引力的变化。仿佛
不需要传递任何信息,你身体的变化都会瞬时影响遥远物体。
当然,牛顿也意识到自己的定律也不像是真的。在万有引力定律已
经被尊称为伟大的自然定律之后,牛顿收到了一封质疑超距作用的信,在回信中他写道:“那些没有生命的物质,不通过一些非物质的中介,可能对另外一些没有接触的物质产生影响。这让人难以置信……引力应
该是物质固有的、内在的属性,是其不可缺少的一部分,所以一个物体
可以(通过)真空作用于远处的另一个物体,而且中间不通过那些可以
使力或作用相互传达的媒介。这对我来说是如此荒谬(重点强调),我
相信任何一个有哲学思考能力的人都不会赞成这样的观点。因此引力必
然是通过遵循特定定律的中介的持续作用引起的,但是关于这些中介是
物质的还是非物质的问题,我就留给读者思考了
[2]。”
牛顿将他对物理学最伟大的贡献称之为荒谬的言论!1666年左右,24岁的牛顿发现了它。他生命的那段时间被认为是他的奇迹之年,这并
不是因为超距作用是一个奇迹,而是因为那一年,牛顿的创造力达到了
顶峰。同年,他还发明了微积分,也成功地将太阳光分解为彩虹的颜
色。提出万有引力25年之后,牛顿非但没有因为不合理性而放弃超距作
用,反而一直在为它的有效性辩护,但他也承认它是十分费解的。他已
经计算出了引力作用的定律,但是仍不明白其物理意义。作为一个虔诚
的信徒,他私下将引力的作用归因于上帝,但是却明智地将这个问题留
给他的读者让他们自己下结论。他以简洁的数学公式描述了奇迹,却无
法解释它。
然而,从1666年到1916年,万有引力定律权威统治了两个半世纪,直到爱因斯坦发现了引力的本质。诚然,中间这些年出现了无数种用复
杂的力学模型来解释引力的尝试,却没有一个在实验或者数学上站得住
脚的。250年间,物理学家以牛顿的万有引力定律为基础做出了很多奇
妙的预言,范围遍及海洋潮汐、地球扁平的形状,甚至日食以及彗星出
现时间。这么一个“荒谬”的定律却取得了巨大的成功,以致其他与引力
无关的物理现象也模仿了它的数学结构,如电磁力。
爱因斯坦反对超距作用,不仅仅因为它与我们的常识违背,更重要
的是和狭义相对论矛盾。1905年是爱因斯坦的奇迹之年,他提出任何物
体、信号、信息的速度都不能超过光速。超距作用却以无穷大的速度穿
越空间,根据狭义相对论这是不可能的。因此爱因斯坦自己发展了一套
引力理论,我们称之为广义相对论。广义相对论展示了空间如何以自身
为媒介通过邻近的相互作用将引力传送到远方。和超距作用相反,这被
称之为定域作用,因为空间中某点只会影响它附近的点,而不是远处的
点。这样一来,如果你向前移动一步,你附近的空间会稍微弯曲一点,通过邻近点的作用,这点扰动向外以光速传播,到达世界某个遥远的地
方,穿过太阳系,穿越银河,传向宇宙的深处。250年之后,万有引力
中的那些奇迹最终被更复杂但也更明确的理论取代了。
牛顿那些值得尊重的旧理论成为这个新理论在某些极限条件下的近
似。虽然它仍是一个非常有用的近似,却已经不具有基础意义。这类似
于,虽然物理学家知道固体、液体、气体都是由原子组成,但仍以连续的物质近似地处理它们。
波函数塌缩也是一种超距作用,因为这也包含着在某一瞬间任意大
的空间区域的突然变化,它和牛顿引力一样让人费解。但是犹如牛顿的
引力一样,波函数塌缩也证实了它的价值,这也让它成为科学正统。绝
大多数的物理学家都将量子力学视为已被证实的事实,例如,叠加原
理、概率解释、波函数塌缩等。他们在计算和观测中获得了成功,并说
服自己:“自然就是如此运作的!”只有个别人会认真考虑这个哲学的谜
题,并试图解决它们,这类人现在也在慢慢增多。这些勇士最核心的目
标就是明确量子定律的第二步,也就是波函数塌缩。它涉及从概率性到
确定性这一令人费解的跳跃。
[1] 图1.12由西德尼·哈里斯绘,“我想你应该在第二步中更显稳重”,版权归Sidney Harris,sciencecar-toonsplus.com所有。
[2] 艾萨克·牛顿给理查德·宾利的信,给宾利的信,16923,与宾利的第三封信,1693年2月
25日,引于理查德·宾利工作,The works of Richard
Bentley,ed.A.Dyce,vol.3(London,1838;repr.,New York:AMS Press,1966),212–213。第7节 量子不确定性
和爱因斯坦的质能方程E=mc
2 以及薛定谔的猫一样,沃纳·海森堡
(Werner Heisenberg)提出的不确定性原理已经成为大众文化的一部
分。不管是汽车贴“海森堡可能睡在这里”,还是电视剧《绝命毒师》
(Breaking Bad )中的现代版“化身博士”沃特·怀特的别名“海森堡”,海
森堡的名字已经代表着量子物理对昔日的确定性的否决。但是将他提出
的原理解释为“任何事物都是不确定的”是人们经常犯的一个肤浅的错
误。比这个错误更严重的是海森堡自己的一个过失。不确定性原理有时
候也被称为海森堡原理,可以看作是从波函数严格、完美推导出来的数
学定理。它表明一个粒子的位置和速度不可能同时完全地确定下来:位
置越精确,速度就越不确定,反之亦然。其他的变量对如能量和时间也
遵循类似的规则。但是海森堡对这个数学定理的解释却是有瑕疵的。
海森堡给出的定理并不是精确的。虽然它在精确地计算中并没有
用,但是它可以作为一个非常有用的经验法则。在原子系统中,在通过
完整的理论给出最终的结果之前,该定理可以很快给出大致的估计。例
如,不确定性原理可以解释为什么量子谐振子的能谱中会有一个最低非
零的能量。假设,相反最低能量是零,所以你就可以确定谐振子的速度
和偏离位置都是零——谐振子没有振动,弹簧也是松弛的。但是这就违
背了不确定性原理,所以上述情况一定是错误的。如果谐振子遵循量子
力学,那么它就必须轻微振动,这样位置和速度也就在变化,因此在一
定范围内是不确定的。基于不确定原理,甚至可以不严格地证明量子谐
振子的最低能量不是零而是e=hf 2。然而在通过认真计算波函数得到相
应的结果之前,你并不能相信这些估计。
经典物理中那些子弹、高尔夫球都有确定的位置、速度及运动方向,不确定性原理与这些明显是矛盾的,海森堡试图给出隐藏在数学表
达式后面的物理本质。这并不是他擅长的,与现实、偏直觉的亚里士多
德般的论证相比,他更喜欢那些抽象、偏数学化的柏拉图式思考。虽然
如此,他还继续从实践的角度用通俗的语言阐明了不确定性原理,他的
解释似乎使包括我在内的好几代物理学家都深深信服。不过现在我们相
信,虽然不确定性原理本身是正确的,但是他的论证则是有误导性的。
海森堡认为量子不确定性起源于测量对被观测的物体的影响。他提
出了一个巧妙的理想实验,被称为海森堡显微镜。考虑一个运动的电
子,为了完全确定它的位置,你必须抓到它,碰到它,或者让它反射
光,至少要用一个光子与它相互作用才能得到它的位置信息。这个与它
碰撞的光子反过来也会使电子的位置或者速度改变。因此当这个被反弹
的光子帮助我们探测到电子位置的同时,观测的另一个结果就是改变了
电子的速度。更细致地研究这个理想实验,海森堡最终可以给不确定性
原理一个貌似合理的物理解释。
他所涉及的应该被称之为观测者效应,这种现象很容易理解,也是
实际存在的。即使不在量子力学中你也可以找到测量对被观测的物体产
生影响的例子。化学家早就知道在灌满热水的罐子里插入一个室温温度
计会使热水的温度降低。律师也都清楚他们问问题的方式会影响最终的
答案。人类学家也小心翼翼地使他们的研究对象尽量不受研究本身的影
响。最坏的情况是一次测量甚至完全破坏了被观察的物体,例如,验尸
可以确定死因,但是尸体本身也已经被破坏掉。
在海森堡提出不确定性原理之后的90年间,物理学家才慢慢意识到
它既不依赖于物理测量的反作用也不取决于测量仪器的精密度。事实上
它有更深层的原因,它是由物质的波的本质决定的,我们经常用波函数
来描述这一本质。经典的波也会显示出固定的持续时间和能量的倒数关
系。设想海面波动后形成一串涟漪。如果这串波只是有几个周期,每个
周期都有波峰和波谷,你可以通过测量时间来确定它的频率。整个涟漪的长度和持续时间很长。另外,如果这串涟漪只有一个孤峰,它的长度
和持续时间可能比较短,但是你不能定义它的频率,因为这至少需要一
个完整的周期。而你最多只能把这个孤立波当作很多不同频率的波叠加
后的结果,这些波恰好在孤立波的最高点附近达到它们的波峰。经典波
的规则意味着波持续的时间越长,它传播的频率就越低,反之亦然。
不仅是水波,声波也满足类似的持续时间与频率的倒数关系,我们
在听一场交响音乐会时就能感受。单簧管持续很久的A调有一个单独
的、明确的音高或者频率。相反,钹碰撞时间通常只有几分之一秒,却
没有可辨识的音高。事实上,印刷版的简谱上对打击乐器是用特殊的记
号而不涉及音高,这是因为碰撞产生的音高是没法定义的,而持续时间
则可清楚表示。
对于一个不稳定的粒子来说,普朗克—爱因斯坦方程e=hf 使经典波
的持续时间与频率的倒数关系转变为粒子寿命与能量之间的不确定性关
系。需要再次强调的是,和推导波函数时一样,普朗克常数仍是连接经
典与量子的纽带。
双缝干涉实验是说明不确定性关系最好的例证。它展现的是电子波
长和路径信息之间的不确定性,这里的路径信息指的是电子到底通过了
哪一个缝。波长可以很容易地从仪器的尺寸和干涉的图案得到
[1]
,而
路径信息却很难得到,除非利用极端的方法。如果你把其中一个缝遮
住,你知道电子只能从另一个缝通过。但是当你这样做时,干涉条纹以
及由它产生的波长的证据就消失了(当然它会消失,毕竟,它是由两列
波干涉而形成的)。对电子路径信息的测量是如此具有极端破坏性,以
至于这种方式完全禁止了另外一条路径。因此这里的不确定性也是极端
的,我们能确定的要么是波长,要么是路径,却不能同时将两者定下。
正当物理学家越发深入地理解不确定性原理时,新的技术使他们找
到新的方式来操作单个粒子,正像前面提到的费曼实验一样,以前的许多理想实验也有望在实验室中变为现实。双缝干涉实验中的不确定性分
析正是如此,他们可以同时得到波长和路径信息,而不是像以往一样只
能在极端的情况下实验。还远不只如此,21世纪初这类实验新版本也明
确地证实了海森堡是错误的:量子不确定性并不是观测者效应。
这个实验的独特创新点是使对路径的观测机制分开足够的距离,以
确保观测不会直接干扰到观测粒子——他们实验中用的是光子
[2]。光
子一旦通过双缝,便会被立刻送入一个特殊的晶体,该晶体可以使光子
自发产生两个等同的(或者互补的)新光子。它们两个各有用途,并沿
着相反方向传播:一个被称为信号,它将贡献屏幕上缓慢形成的干涉条
纹,另一个起到目击者的作用。每一个信号光子都有其对应的目击者。
目击光子在原来的光子通过双缝之后到达它最终的目的地,这也解
释了为什么该实验被称为延迟选择实验。通过不同的标准方式安置的光
学“魔法”镜,能够确定原来的光子到底是通过了哪个缝,或者完全不知
道从哪个缝过来的。
通过这样的布置,信号探测器通过广泛的扫描就可以探测到成千上
万的光子。这些被探测到的信号光子对应的就是旧式双缝干涉实验中屏
幕上的点,只不过这里每一个信号光子都有它相应的目击者。这样,实
验者就可以选择性地处理数据。第一种情况,从所有收集到的数据中,他只选出目击光子没有泄露路径信息的信号光子,并画出信号探测器的
位置(对应之前的屏幕上的点),他会发现期待中的条纹状图案。事实
上,这种情况相当于他重复了一遍1803年托马斯·杨做的实验。第二种
情况,他也可以选出那些目击光子透露路径信息的信号光子,这时就不
再会有条纹出现。但是这两种情况下,双缝都一直保持敞开。
实验结果所包含的信息是十分清楚的。作为目击者的探测器离得如
此远,以至于它不可能影响双缝附近发生的事情。和把其中一个缝堵住
不同,条纹的消失不是因为观测路径引起的力学效应。简而言之,不确定性原理不是观测引起的效应。
从海森堡的显微镜到将不确定性原理解释为波函数基本的、普遍的
历程,使人想起量子力学历史中其他类似的情况。普朗克建立的发光物
质的力学模型引出了波粒二象性,进而由波函数解决。一个纯粹数学上
的波函数加上相应的概率解释替代了玻尔力学的氢原子模型。两种情况
都显示一个力学的、容易想象的描述是不充分的,它们最终都会由抽象
的数学描述替代。
抽象是成熟的标志之一。儿童开始只是通过算账来学习关于钱的知
识,但是后来他们的理解扩展到一些抽象概念,例如,成本、价格、贷
款等。从社会角度来看,正义的概念从简单的、个人的“以牙还牙”的原
则发展到复杂的、抽象的法律系统。在物理中,成熟意味着摆脱切实的
力学模型转向数学的抽象概念(拉丁语中的抽象abstrahere ,意为使脱
离)。但是抽象万不应该与复杂混淆。一个概念可以抽象,但是它无须
复杂。
[1] 波长≈xdL,其中x是干涉条纹的距离,d是两个双缝的距离,L是双缝到屏幕之间的距
离。
[2] Bram Gaasbeek,“Demystifying the Delayed Choice Experiments”,July
22,2010,http:www.arxiv.orgabs1007.3977.第8节 最简单的波函数
对大多数人类活动来说,“从简单开始”是一个很好的忠告。即便在
科学中也是如此,尼尔斯·玻尔从最简单的氢原子开始研究而不是更复
杂的其他原子;量子力学也只是在最简单的谐振子上获取经验。因此,我们这里也从最简单的波函数开始。这个例子不涉及数学方程,而是以
栩栩如生的符号出现,并且它将展现出波函数四个基本的特性:叠加、概率、离散和塌缩。在后面我们探讨量子贝叶斯的含义时,这个例子依
然很有用。
即使最简单的原子也拥有错综复杂的结构,这里我们只考虑基本
的、不可分割的粒子。之前我们已经遇到过两个:光子和电子。光子不
能用简单的语言描述。在真空中它们总是以光速传播,而观测并不能使
它减速或者停止。当它们被探测到时,也就意味着它们消失了。波函数
和通常的量子力学已无法描述光子幽灵般的行为,物理学家必须用更复
杂的方式。而电子却如同弹珠一样,我们可以使它减速、停止,也可以
轻易地储存它、检测它,甚至操纵它。因此电子和我们的日常经验更接
近。另外,电子不仅是包括我们身体在内的各种物质的必要组成部分,而且作为能量(电线中)和信息(计算机中)的载体使我们的生命得以
维持。电子是我们探测微观世界再合适不过的工具了。我们一般用位
置、速度、质量或者重量以及电荷等来描述电子。另外还有两个其他相
关的特性,其中一个是它围绕自身的转动,称之为自旋,另一个是磁性
[1]。电子就像微小的磁棒或者缩小版的指南针一样,拥有稳定的、可
精确测量的磁场强度。量子力学准确地预言了这一强度,并且让人难以
置信的是精度高达十亿分之一(这大概是你拇指宽度与纽约到夏威夷距
离之比)。上面所列举的电子特性也适用于球形的、带电的塑料球。当这个球
围绕着自身的轴转动时也会像一个磁棒一样。因此我们倾向于把电子想
象为缩小版的地球。它比地球要简单得多,因为电子是完美的球形,此
外它的自旋轴和磁轴是重合的(和我们生活的地球不同,一个旋转带电
的塑料球的磁轴也是穿过它的两极的)。但是量子力学不只是微小物质
的经典力学,仔细研究电子会使我们逐渐发现新大陆。
你是否注意到之前我们列举的电子特性里面包括电子的质量却没有
提它的尺寸?电子到底有多大?或者说有多小?令人惊讶的是不管多么
精确、复杂、昂贵的实验都不曾测到过电子的尺寸。说的更确切些,一
旦理论学家给电子设定一个很小的半径,很多预言都会出现问题,包括
我们前面提到的高精度的电子磁场强度。最好的假设就是电子的半径是
零,这样理论预言才能和实验测到的结果一致。根据我们现在的知识,电子可以严格当作点粒子。当然也许未来有一天我们发现电子确实有下
层构造,相应的也有半径,但是迄今为止,这只是主观猜测。所以我们
就干脆把它想象成一个没有大小的粒子吧!
可是问题来了,一个点粒子怎么可以围绕自身的轴旋转呢?一个点
可以围绕着另外一个点转动,但是一个点围绕着自身转动就讲不通了。
自旋意味着物体不同的部分绕着穿过该物体的某个轴运动,但是一个
点,它根本就没有不同部分,不可能自旋。把电子当作旋转带电的球是
一个不可靠的力学模型。自旋这个词如同玻尔的氢原子模型一样,是很
有误导性的概念。不幸的是,我们只能被迫接受相互矛盾的结论:电子
有自旋和磁场,却没有体积大小。
在发现波粒二象性时,我们试图将宏观世界的概念强行应用到量子
的微观世界出现了很多问题,这里再次出现了同样的情况。我们不得不
用更丰富的想象力才能使自己内心得以平静。也许我们可以类比《爱丽
丝梦游仙境》中常露齿嬉笑的猫的遭遇。随着它的身体渐渐模糊并最终
消失,这只猫只留下了它的露齿笑。这促使爱丽丝察觉到她经常见到一个不露齿笑的猫,但是从来没遇到过露齿笑的猫。电子就像越来越远的
转动的球一样,越来越小直到最终消失,但是自旋仍在。
自旋还有更多的谜题。电子的自旋不像小球一样可以随意减速或者
加速。它有一个固定的大小,而且和无处不在的普朗克常数相关。
为了查明电子内在的指南针(相应的自旋轴)到底指向哪里,你可
以把它放到一个普通冰箱磁贴的北极附近。电子会排列好,并且它的磁
场的南极将指向磁贴的北极。你可以把电子翻转,使它指向相反的方
向,就像你用手指推指南针一样,但是你必须要消耗一定的能量才能做
到。
一个普通磁棒的磁场强度和方向是可以随意变动的,与之不同,电
子的磁场强度是固定的,方向也是受限的。尤其是测量电子的自旋(相
应的磁性)时,只有两个值可以出现。测量自旋的仪器都包含一个固定
的外磁场作为任意选择的参考方向。奇怪的是,电子的自旋总是沿着选
定的参考方向,或者与之相反。即使我们将它转向反方向,它也不会沿
着与外磁场垂直或者呈45°夹角的方向。电子的磁性(或者自旋)经常
用向上或者向下的箭头表示。当测量垂直方向的自旋时,它总是指向上
↑或者下↓,而不会出现与垂直方向有一定夹角的情况。同样的,如果参
考磁场的方向是水平沿着x 轴的,那么电子将只可能指向左边←或者右
边→。一个自旋球的自旋方向是任意的,而电子却只有两种。对自旋方
向的限制正像对谐振子或者原子能量的限制。这也让我们联想到一个长
笛的音高限制。
如同其他描述原子世界的变量一样,自旋也服从不确定性原理或信
息权衡。如果你准备一个自旋指向上的电子↑,然后测量水平x 轴方向的
自旋,那么结果是随机向左←或者向右→。相反,如果你知道电子自旋
是向右的→,沿垂直方向测量,那么最后结果向下↓或者向上↑也是随机
的。我们已经到达量子力学的核心地带。自旋遵循着特殊的规律,虽然
在被费曼称之为“量子力学之谜”的双缝干涉实验中并不起作用,但是它
仍是一个不可思议的事情。
实验中所涉及的电子的波函数通常包含两部分。“外部”波函数主要
涉及电子在空间的运动,例如,我们之前遇到过的在原子中的电子,或
者从电子枪到屏幕,通过双缝的电子都属于这一类。另外,电子还
有“内部”波函数,它只处理电子自旋。一般在计算中,这两部分波函数
总是交织在一起。但是我们可以将两部分区分开,忽略外部波函数,而
只关注内部波函数。这样我们就达到了我们本节开始提到的目的:最简
单的波函数。
外部波函数可以在三维空间中散布开,在空间任意点的值都对应着
在该点发现电子的概率。与之不同,自旋波函数并不生活在真实空间
中。自旋波函数的发明是量子力学早期历史中里程碑式的事件,它是纯
抽象的量子力学的构造物,与我们日常生活没有相似的地方。这意味着
每一个电子拥有“双重性格”,只有在它的磁场或者自旋方向被观测时,它才会展现真实的自己。否则,它的双重性格就会一直隐藏在另一维
度,和我们生活的空间没有什么联系。
我们往往无法看到量子力学所展现的神奇世界,并不是因为它们通
常很小,而是因为它们中的一部分我们只能通过想象而不能通过常识来
理解,电子自旋正是我们窥视这个神奇世界的锁孔。在众多爱因斯坦的
名言警句中,其中最鼓舞我们的一个是:“上帝难以捉摸,但并不心怀
恶意。
[2]”暂且不管上帝,这句话告诉我们,虽然自然的秘密总是隐藏
得很深,而且很难梳理清楚,但是最终都是可以用理性和想象力理解。
每当自然呈现给我们一个明显的悖论时,它总是同时亲切地悄声告知我
们解决它的线索。电子自旋就是它给予我们的线索:它让我们窥视到了
量子世界的种种秘密。自旋这个词很容易让我们联想到棒球或者溜冰者,在量子力学中是
不恰当的用词,自旋波函数的两个可观测的态也不是必须被标记为顺时
针或者逆时针。事实上,它们也可以被称为上下、左右、+-、是否、正面反面、开关或者黑白,但是为了与计算机编码联系到一起,它们
按照惯例被记为0和1。这两个数字就像页码一样只是方便的记号。
除了用于描述电子自旋或者磁场,自旋波函数在其他方面也大有用
武之地,它可以用来描述任何具有两个组态的量子系统。这样的例子有
很多,比如,分子两种不同的结构之间的转换,线圈中顺时针或者逆时
针的电流,原子中两能级系统,光子水平或垂直方向的极化,放射性的
原子核的状态,等等。最简单的波函数都能够恰当描述类似的系统。由
于自旋波函数十分简单,在大学开设的量子力学初级课程中,它逐渐取
代了费曼的双缝干涉波函数。
用表格的形式,电子自旋是用2×2的矩阵来描述的,这是最小的方
阵(一个1×1的矩阵不应该被称为矩阵,它只是一个数字,而且并不能
展示出量子叠加)。
和电子自旋相似的系统无所不在,因此它们获得了专有的名字。任
何只有两种可能态的量子系统被称为一个量子位(qubit,英文发音为
cubit)。英文单词qubit 是quantum bit (量子比特)的缩写,而bit (比
特)这个英文单词是binary digit (二进制码)的缩写。经典的比特
(bit)表示一个可以取值0或1的量,是从拨动开关开和关的状态抽象出
来的符号。而一个量子位是一个真实的量子力学的物体或者系统,它指
代具体的事物而非一个符号。
但是要注意的是,量子位这个词与本书的主题量子贝叶斯理论
(QBism )没有关系。有趣的是,英文单词qubit和QBism都有一个同音
异意词cubit(腕尺)和Cubism(立体主义),它们分别指古时候一种测
量长度的方式和20世纪初艺术的一个流派。不仅这两个同音异意词完全
没有关系,而且qubit和QBsim也是毫不相关。qubit和QBsim的第一个字母q 意义是一样的,都是指quantum (量子),但是qubit的小写字母b
指的是binary (二进制的),而QBsim的大写字母B 则指的是Thomas
Bayes(托马斯·贝叶斯),他是18世纪的一个牧师。有时候混乱的科学
术语会产生一些奇怪的组合。
一个量子位的数学表达方式被称为量子位波函数(qubit
wavefunction )。为了区分量子位和量子位波函数,本书中我将用斜体
的量子位来表示量子位波函数。这种字体是为了强调两者的区别,因为
在学术文献中柯日布斯基的警告经常被忽略
[3]。
对于特定的实验系统,通常可以用球面上的一个点来代表量子位。
球面上的任意点都对应着一个概率。不管实验测量的结果是什么,在球
面的两个极点分别被记为0和1,在这些极端点之间则表示这两个值的混
合或者叠加。例如,在球面赤道上的点对应的量子位表示结果为0的概
率为50%,就像抛硬币时正面向上的情况。在北半球的纬线代表着实验
结果是0的概率要大于1,在南半球则相反(见图1.13)。图1.13
和纬线不同,球面上点的经线并没有经典对应。这完全是量子力学
的变量,代表着相位,对应着想象的抽象空间的角度。球面上两个相邻
的量子位更倾向于干涉加强(两个波函数波峰遇波峰,波谷遇波谷),然而球体相互对立的两个点则干涉减弱(波峰遇波谷)。相位是效仿经
典波,它最显著的一个特性就是叠加,量子力学最初就是由此受到启
发,并在波函数中沿用了“波”字。
因此,这个量子位球面直观展现了叠加现象,以及相应的概率解
释。除了两个极点,球面其他地方的点并不能预言出单次测量的结果。
重复进行一模一样的实验将得到一串随机的0和1组成的数字。点所在的
纬度则预示着0和1在这一串数字中出现的概率。
比较特殊的是两个极点,它们不是叠加的状态,没有相位,这反映
了量子力学的不连续性。就像量子谐振子或者一个原子的能级是分立的、可数的,而非连续的,其他的很多测量结果的个数也都是可数的。
电子的自旋就是如此,量子位有两种可能的结果,极点代表确定的状
态。总之,这两个极点组成一个比特(bit)。
或许量子位最引人注目的信息并不是我们看到的球面。它并不是一
个电子的照片或者玻尔的氢原子模型。它存在于我们想象的三个维度
中,而非我们现实的世界。这个球面的点隐含着实验测量结果出现的概
率,但是当我们做出测量之后,系统将跳到0或者1。这种跳跃就是“臭
名昭著”的波函数塌缩。
球面上的点可能一直保持位置不变,也可以沿着某条规定的路径移
动。例如,设想在某时刻产生一个有辐射性的原子核,我们可以用量子
位的值来表示该原子核的状态。如果它已衰变分裂或者发射出某种辐
射,那么将之记为1,反之则记为0。最初球面上的点在北极点,对应着
0。随着时间的推移,该原子核已衰变的概率也在慢慢增加,所以对应
的球面上的点也将向下逐渐滑向南极点。不管怎样,只要我们不观测原
子核,球面上的点也绝不会到达南极点。如果你确实观测了原子核的状
态,那么你会发现它已衰变或者仍保持稳定。这时,量子位将塌缩到其
中一个极点。未观测前球面上点的路径是可以通过量子力学精确地预言
出来的,但是量子力学却无法解释瞬时跳跃回北极点或者向下跳到南极
点的情况。测量之后量子位将限定在一个比特的取值0或者1,但是测量
前它并不对应一个比特的取值。
量子位球的图像并没有解释叠加、概率、离散性或波函数塌缩,也
不能展示它所代表的数学方程,但是它能够栩栩如生地展示量子力学最
基本的要素。虽然它看起来和波没有丝毫关系,但我们仍称之为最简单
的波函数图像。
[1] 一般情况下一个物体的转动程度是由角动量衡量的,而角动量依赖于物体的质量、形状
和旋转速度。让人惊讶的是角动量的单位和普朗克常数h是一样的,这一巧合也启发了玻尔建立
旧的氢原子模型。[2] “Raff i niert ist der Herr Gott,aber boshaf t ist Er nicht”,Alice Calaprice,The Expanded
Quotable Einstein(Prince ton,NJ:Prince ton University Press,2000),241.
[3] 柯日布斯基为波兰裔美国学者,他发展了普通语义学。——译者注第二章 概率
第9节 概率的烦恼
量子力学的规则在构建波函数的时候如同水晶一般给出了清晰的指
示。有时,在解答的过程中也许会遇到数学和计算上的困难,但是物理
学家很少对做什么有疑问,只有如何做才会让他们抓耳挠腮。最终,在
一番辛勤劳作之后,他们得到了波函数,并准备将它应用在实验中。
理论和实验之间的联系最终被证明是概率:要么是波函数预测了各
种可能结果的概率,实验室则提供数据来检验它;要么反过来,实验上
测定的概率引导物理学家计算出相应的波函数,由此可能得到其他实验
的信息,并对那些实验做出预测。初看上去,概率是如此基本以至于直
观上看显得平淡无奇。几乎每一个足球队长都知道,在掷硬币的时候,出现正面的概率是多少?12或者50%。掷一对骰子时,摇到6点或者7点
概率哪个更大?我们计算下可能的方式。一共有6×6=36种可能的投掷方
式,但是只有少数几个方式产生6点和7点:(1,5),(5,1),(2,4),(4,2)和(3,3)与(1,6),(6,1),(2,5),(5,2),(3,4)和(4,3)。这两个概率分别为536≈13.9%和
636≈16.7%,因此得到7点的概率比6点的概率大约高3个百分点,掷骰
子赌博的赌徒也一定从经验中留意到了这一点。
简单来说,一个事件出现的概率等于想得到的结果的数目(举例而
言,出现6点)除以所有可能事件的数目(如之前提到的36)。即使事
件的数目不可数,这个公式也行之有效。例如,一个被蒙着眼的孩子向
海报上投掷针,假设针落到海报每个区域的概率是随机的,那么她扎到海报上的一头驴的概率是多少呢?只要把驴的面积除以整个海报的面积
就可以了。结果是分布在0和1之间的实数——一个合理的概率,以分数
或者百分比表示出来。
这样计算出来的概率是理论上的抽象数字。在复杂的情形下,它们
是如何相加或者组合在一起是纯数学分支中一个被称为概率论的学科研
究的问题。这个理论处理的概率并不比欧几里得几何中细线、无维的点
以及完美的圆更真实。概率论和欧几里得几何的抽象之处是否有现实中
的应用不是一个逻辑上的问题,而是关乎实验和观测——这是一个科学
问题。我们或许觉得抛硬币或者掷骰子是如此简单以致我们关于它们的
直觉无须验证,但是就像生活中的许多事一样,真理往往妙不可言。面
对惊喜最好还是提前做好准备!
考虑一个被称为方块工厂(cube factory )的悖论,它是由哲学家
巴斯·冯·弗拉森(Bas van Fraassen)基于一些古老问题中类似的困惑而
提出的(这个例子在量子贝叶斯框架下似乎特别恰当)。想象一个陶瓷
工厂,它生产出一大堆小的陶瓷立方体,它们边长随机分布在0到1厘
米。你随机捡起一块并且检测它,那么你所测量的立方体的边长介于0
到0.5厘米的概率是多少?一个非常诱人的答案是0.5,因为期望的结果
区间正好是所有可能的区间的一半。但是,等等!注意到,立方体的每
一面的面积都是在0到1cm2 。那么,在你手上它的一面测量的结果在0
到0.5cm×0.5cm或0.25cm2 的概率是多少?既然0.25是总的分布区间的
14,那么你的立方体落入这个区间的概率也应该是“14”。情况会变得
更糟糕。如果你测量的是立方体的体积而不是边长或者一个面的面积,体积的变化则从0到1cm3 ,然后问题就变成:你测得0到
0.5cm×0.5cm×0.5cm=0.125cm3 的概率是多少?答案是“18”。对于同一
个简单问题却存在三个不同的答案,这就是我们要说的悖论。那么哪一
个是正确的呢?
从数学上来讲,这个问题没有答案。在现实情况下,通过考虑实际生产过程,或许能挑出其中一个答案。在机器内部的某一部分一定存在
着一些随机的过程。是否有一个卡尺在随机地测量0到1厘米?如果是这
样,那么第一个答案是对的。或者是一个天平在称量黏土的重量?使相
应的体积在0到1立方厘米随机分布,而这团黏土随后会被塑造成一个完
美的立方体。在这种情况下,第三个答案是对的。或者说这个随机化也
可能以另外一种不同的方式发生,相应地也就产生了冯·弗拉森问题的
第四个答案。
方块工厂给我们强有力的提醒:概率是一种非常尖锐的数学工具,在现实应用它时,需要倍加小心。
不仅仅在逻辑和数学中,就连自然本身也会产生出惊奇的事情。考
虑两个球,被画成白色和黑色,分别被随机地存储在不同的壶中。只有
四种方案去分配它们:(白黑,0),(白,黑),(黑,白)和(0,白黑)。发现两个球在一个壶里面的概率显然是24或者12。这种决定
概率的方式是数个世纪以来标准的计算方法,而且看上去非常明显。在
划分两个候选人的选区或者计算出扑克牌的胜算时它也是非常有效的方
法,但是在量子世界中,它则被证实是错误的。
光子并不像壶里面的球。它们表现了量子力学的另外一种特性,这
种特性在现实中是不曾见到的:相同频率(相同颜色)的光子彼此是完
全不可区分的。新的硬币看上去彼此相似,但在微观尺度,它们高低不
平的表面很容易被区分。即使在我们当前技术能分辨的层次上硬币是一
模一样,不论它们去向何方,它们在穿越时空的时候总可以被追踪到并
且以此去区分它们。硬币可以根据它们的历史还有它们的样子去区
分,“这是美分A,另一个是美分B”通常是正确、可靠的说法。然而对
于光子来说,却无法那样去标记它们。一旦彼此靠近,它们将表现出波
的特征,叠加在一起,然后失去原来的特点。与硬币不同的是,它们在
根本上就是不可区分的。
以两种不同极化方式(相当于经典例子中的壶)分布,用两个星号代表光子,分配两个全同光子的可能方案是(,0),(,),(0,)。现在,发现两个光子在同一个极化态则由12上升到23。这
一变化看上去并不多,但是当我们在现实应用中重复数万亿次时,它从
根本上改变了光子的统计。印度物理学家萨特延德拉·纳特·玻色
(Satyendra Nath Bose)率先得到这种非同寻常的计数方式,通过研究
光子而非假设的谐振子,他成功地重新得到普朗克辐射定律。作为创造
光子这一概念的人,爱因斯坦也惊讶于这种计算并对它印象深刻。他确
保其他物理学家都知道了玻色的结果,之后他将玻色统计方式推广到有
质量粒子。80年后的2001年,诺贝尔物理学奖授予了由若干原子展示的
玻色—爱因斯坦统计的实验观测。
电子同样彼此不可区分,但是它们遵循第三种统计方式,与传统的
版本以及玻色的版本也不一样。电磁表现出与光子相反的特性。光子倾
向于彼此挤在一起,而电子则尽可能彼此分离。如果两个壶替代为原子
中的能态或者两个自旋相反方向,量子力学中一个被称为不相容原理
(exclusion principle )的规则禁止两个电子占据同一个状态。因此,态
(,0)和(0,)是严格被禁止的,只有(,)是被允许的。如
果这个规则被突然之间神奇地终止了,那么原子中所有的电子将落在最
低能态,化学品之间的区别将因此而消失,所有的物质将会塌缩。
计数方式的两个简单改变,修改了潜在的概率,接下来决定了粒子
的量子统计以及导致了物质和辐射行为的深远结果。事实上,这个结果
不仅仅深远——它们关乎存在。没有玻色—爱因斯坦凝聚或者不相容原
理,我们所熟知的世界将不复存在。
试图按照你对大理石的分类方法对基本粒子进行分类,同样会引起
不恰当的问题,而在之前我们就遇到的波粒二象性以及旋转点的概念,现在再次发生了。基本粒子并不按人类常识期待的那样表现。
当量子物理学家第一次引用概率时,像方块工厂或者粒子统计这些
理论和实验上的惊奇之处应当引起他们足够的注意,但是他们并没有注意。尽管这么去思考事情更加周密,但他们并没有这么做,部分原因在
于物理学家对哲学的猜疑,甚至接近于蔑视。事实上,概率不仅是生活
常见的、每天都会涉及的概念,甚至小孩子都会用到,而且也是多个世
纪以来学者争论不休的学科。在任何情况下,不论是什么原因,当理论
和实验最终相匹配的时候,量子物理学家降低了他们的防备,放弃了他
们批判性的才能,并且想都不想地附和长盛不衰的概率的定义——“期
望的样本除以所有的样本”。
因为它是基于计算事件出现的次数,在这种解释的情况下,概率的
含义被称为频率概率。从19世纪中期到20世纪上半叶,它已经被发展成
严格的数学定律,并且在学校中作为一种不证自明的真理去教导。它被
定义为数字的比例,并且在观测中也可以做到,频率概率呈现出一种客
观的样子。掷硬币中的50%概率展示了硬币真实且内在的属性,如同质
量和尺寸一样是可测量的属性。
但是即使最坚定的频率学家也并没有走得更远。他们宣称客观的特
征仅仅是从一系列掷硬币的过程中得到的,而不是来自一次对硬币的检
验或者一次投掷行为。他们对概率的定义被发掘出来都类似如此:“在
大量掷一个两面平衡的硬币时,正面的概率是50%,所以投掷出正面的
概率接近12。”但是数学家并不满足于模糊的字眼,如大概、大约、近
似于这些词。因此他们假设一个无穷次的掷硬币过程作为替代。相应
的,正面出现的概率达到了50%,因此概率是12。不幸的是,这种假设
同样失去了它的客观性——它是假设且实验上并未验证。
频率概率所面临的另外一个问题是公平(fair )这个词。有必要做
出如下假设:硬币是完美对称且每一次投掷的行为是完全一样的。事实
上,这是一桩美事。假如在每一次都非常仔细地完全一样地掷硬币,就
像假设的那样,至少在牛顿的经典决定性世界中,结果总会是一模一样
的。没有正面和反面的随机序列,那么掷硬币也不会遵从概率论。因此
实验处理的是关于硬币和掷硬币的有限信息——有限到允许一些变化但是还不足以阻止如定律般的统计规律的出现。
正经的数学概率学家面对这些担忧往往选择隔岸观火,并且只是假
设概率有些精确的数字(如假设的掷骰子中的16)并且把无限次执行
当作原始的公理,以此把现实世界中的应用留给了赌徒、民意调查专
家、医药统计学家以及物理学家。数学家对凌乱的现实应用避而远之。
明知道一个硬币不可能被掷无限次,数学家还是精确定义了它并使之成
为一个公理,然后证明他们关于完美的硬币、无偏的掷硬币以及无限耐
心的定理。但是物理学家没有这么奢侈。
概率的频率解释中最有成效的一个原理也是最有效地将数学和现实
世界经验分开的一个原理。它声明概率用于多次实验而对单个实验或者
事件只字未提。对频率论者来说,“单个事件”概率是毫无意义的,就如
同对一个单独的数字讲“差值”或者对一个孤立粒子谈“吸引”。
无法理解这一限制就会得到赌徒谬论(gambler’s fallacy ),这是
学校老师最担心被问到的问题。硬币已经出现正面100次之后,出现反
面的概率肯定高于50%,因为出现101次正面是极其不可能的事。特别
是,赌徒谬论暗示掷硬币、摇骰子、发牌、转轮盘已有的结果(大量的
结果可以定义概率)对下一次的结果毫无预测能力。这个规则被灌输进
学校孩子的脑中,并被当作广为接受的智慧。
频率概率对于物理学家在处理精细控制下的多次实验时是有帮助
的,但是它排除了概率与我日常所见的单个案例的概率的相关性。在频
率概率论的框架下,诸如“今天下午有30%的概率会下雨”“牛奶可能变坏
了”和“她也许喜欢我”,是毫无意义的。
这里有一个故事可以凸显出课本上的概率论和日常经验所用的概率
之间存在的巨大鸿沟。在朋友的陪伴下,你进入了一个礼堂,在台上,一个赌徒正在掷硬币并且邀请你加入。“我和你打赌一块钱,结果是正
面,”他说道,“正面的话你给我1元钱,反面的话我给你1元钱。就是这么简单!”相信赌徒谬论,并且想体验一把刺激,你觉得有必要试试运
气。但当你张嘴准备说话的时候,你的朋友在你耳边耳语说:“前100把
他扔出来的都是正面!”
那么问题来了:下一步你怎么做?请不要把这个故事变成一个枯燥
的教科书问题:硬币是否有偏差?你的朋友得到的消息是否有谬误?这
个赌徒会不会出千?仅仅让这些流于表面吧,考虑下什么会真实发生。
请竭力去把它想象成现实中的含混之处和不确定性。对我来说,答案非
常清晰:我将屈服于不足信的赌徒谬误,相信过去的事情会影响现在的
概率,拒绝频率概率论,并且相信我的直觉。即使连续出现100次正面
理论上是可能出现的,并且不会影响下一次的投掷结果,但是我仍然不
会打这么一个赌。
一个统计学家也许通过如下假设去定义他的理论:如果硬币确实是
公平的,而且投掷的行为确实是公正的,并且你的朋友和赌徒都是诚实
的,然后我就应该打这个赌。没有更多的证据,我就不愿意冒这个险,即使仅仅1元钱。那么你呢?
什么会说服我这个硬币是公平的?如果我或者我信任的人掷硬币
100次,并且看上去随机出现大约一半的正面,我将同意公道的人说它
事实上是公平的,至少对所有的现实目的都是如此。但是我用于得到这
个结论的论证似乎并不是如它所看上去那样直接。
数学物理学家马库斯·阿普尔比(Marcus Appleby)是量子贝叶斯理
论的早期支持者之一,他用一个生动的寓言故事阐述了这个观点
[1]。
如他所述,想象一下,爱丽丝(Alice)在欧洲转动一次有37个数字的轮
盘,得到数字11,并且得出结论:轮盘是公平的。她的论证肯定是存在
问题的,并且一个正常思考的人应该都不会轻易相信她。一次转动的结
果不可能暗示转盘的任何公平性。现在假设不一样的情况,鲍勃
(Bob)投掷100次硬币,获得了一个正面和反面的序列,在检查之后,发现是由50个正面和50个反面组成,看上去顺序也是随机的,因此得出
结论说硬币是公平的。(见图2.1)
如果鲍勃仅仅依赖这些观察到的现实而没有做其他事情,他所得到
的结论并不比爱丽丝的强。从数学概率论角度去看,100次掷硬币的序
列等价于一个2100 个扇区的巨大转盘,其中每个扇区由不同序列的100
个正面和反面的序列组成(如果它被设计为弹珠大小的球,那么这个庞
大的机器在我们可观测的宇宙这么大的体积内都装不下)。其中的一个
扇区正好精准地用的是鲍勃得到的序列标记。因此在转动这一巨大的轮
盘一次之后,他获得了结果,从这个结果出发,他得到了结论:其他序
列是可能的,并且轮盘、硬币都是公平的。尽管在规模上存在巨大鸿
沟,但是鲍勃的论证和爱丽丝的论证一样是错的。
阿普尔比创造这个故事是为了解释概率的频率概念令人不安的不一
致性。严格来说,对单个事件,概率的定义是不存在的。期望的结果被
所有可能结果否定是大量重复性事件系统的一个性质,不论这个事件的
数目是有限的还是无限的。并且,如轮盘故事展示的,用于单个事件的
概率论,即所谓的单事件概率,被频率论者默默使用着,尽管他们无法
定义它。图2.1
为了宣称他的硬币是公平的,事实上鲍勃必须拒绝轮盘类比并且做
出依赖于一些不言而喻的假设的论证。他必须假设100次投掷硬币是彼
此独立的,且出现正面的概率对每一次投掷都是一样的。但是,即使是
这样也远远不够。如果他做出这些假设并且用12作为出现正面的概率
的数值,他得到所观察的序列的概率是极小的,为 [数字( 小得
令人难以想象,它代表着把米尺对半切100次,并且非常巧合的是,在
米制单位中,它仅仅比普朗克常数大一点点]。不幸的是,鲍勃对这个
无穷小的概率无能为力。就像爱丽丝获得11这个数字的137概率,并无
助于公平性一样。特别是,即使非公平的硬币可以产生鲍勃所观察到的
正反面的序列。鲍勃必须深究这个理论,不再假设投掷硬币正面概率是
12这一假设,而是考虑其他的概率。假设值是0.7或0.2,则分别意味着
偏向或者偏离正面,他必须对特定的序列的概率进行重复计算。只有在这个时候,他才能得到一个有益的结果:他计算所观察到的概率,尽管
很小,当假设概率是0.5的时候远比假设硬币有偏差的时候大。这里,我们最终得到这个问题的数学答案:硬币是公平的吗?是的,因为概率
12是在数量上最可能的假设。
注意到鲍勃是被迫那么做的。他一遍又一遍地涉及单个、孤立的投
掷硬币的概率,即单事件概率。首先他必须假设每一次投掷的概率都是
一样的,这个声明只在概率是定义在单次投掷的情况下才有意义。其
次,为了找到在整个序列中概率最大的序列,他将每个真实的数值分配
给单事件概率。只有当特殊值最终出现在0.5附近,才能够宣称这个硬
币是公平的。
马库斯·阿普尔比得出结论,频率概率并不仅仅基于大量的实验,无论是有限还是无限。为了保持一致,它必须承认单事件概率作为最基
本的元素,如同概率论中的“原子”一样。简而言之,频率论并不自洽。
在他的文章最后,阿普尔比感谢了量子贝叶斯理论的共同创始人克
里斯,因为他让阿普尔比“看到了问题的重要性”。这个感谢暗示了量子
贝叶斯者所面临的艰难战役。物理圈中我的大部分同事并没有意识到频
率论的观念所存在的问题,他们也领会不到这个问题的重要性。
[1] D.M.Appleby,“Probabilities Are Single-Case,or Nothing”,Optics and
Spectroscopy,99(2005):447–462,http:arxiv.orgabsquant-ph0408058.第10节 贝叶斯牧师的概率
量子贝叶斯理论(QBism)建立在贝叶斯统计的基础之上。贝叶斯
统计是概率解释一个流派,以托马斯·贝叶斯(Thomas Bayes,1701—
1761)牧师命名。他是长老会的一名牧师,同时也是非常有才能的数学
家和统计学家。他因一篇死后才发表的论文出名,在这篇论文中他提出
了现在被称为贝叶斯定律(Bayes’law
[1]
,也称为贝叶斯定理、规则、公式、方程)的定律。贝叶斯概率理论最初由著名的天文学家和数学家
皮埃尔·西蒙·拉普拉斯(1749—1827)开创,经过随后几代学者的努
力,现在正在蓬勃发展。其中贝叶斯定理是贝叶斯概率理论的核心。
拉普拉斯之后的一个世纪,概率和统计理论在贝叶斯定理的传统中
平稳发展。为了使概率更加“客观化”,一些数学家在重复试验中引入频
率的定义。约翰·维恩(1834—1923)就是其中著名的一个,说起他,我们首先想起的就是以他名字命名的维恩图。我们耳熟能详的简单的公
式“事件发生次数除以总试验次数”已是学校概率课程中的基本内容。物
理学家也采用了这种频率论,因为物理实验通常是简单的、可重复、可
量化的。而其他的科学则往往没有这么简单,尤其是生物学、心理学、经济学、医学。这些学科实验中的不确定性通常相当大,很难实现毫不
含糊的实验。但是学者仍试图将它们联系到假想的可无穷次重复的实
验。20世纪中期,情况有所转变,人们开始考虑更古老的贝叶斯理论作
为取代频率论者的一个选择。天文学家和物理学家也面临着大量的数
据,需要统计分析处理,他们也开始重新发掘贝叶斯理论
[2]。最终,在千禧年之际,量子物理学家也赶上了这个潮流,量子贝叶斯理论诞生
了。
经过数学家、统计学家以及数学哲学家对贝叶斯概率概念更深入地分析和重新组装,最终使最初的贝叶斯理论更加丰富,并产生了大量的
变种。量子贝叶斯理论正是基于贝叶斯理论其中一个版本,被称为“个
人的”(personalist)或者“主观的”(subjective)贝叶斯概率。本书中,我只考虑这一版本。
概率就是测量事件发生的可能性。在我们日常对话中,可能性通常
被表达为下面这些语句,例如不可能、不太可能、也许、不好说、可
能、很有可能、十拿九稳、必然的、毫无疑问等,但是在科学中最好是
将概率赋予对应的值。对于理想简单的情况下,例如,抛硬币或者发射
电子,频率概率论仍是可行的,因为这类情况可以在可控的条件下试
验。但是为了做到逻辑自洽,也出于实际应用的角度,我们需要定义可
用于单独事件的概率。频率论做不到这一点。
贝叶斯理论认为概率并不是寄存于外在物质世界,而在一个被称之
为代理人(agent )的意识中。在这一方面代理人(agent 来自拉丁语
agens ,意思为“做”)并不是其他人的代表,而是指能够做决定和执行
行动的人。贝叶斯概率测量的是代理人对某一事件是否发生或者命题是
否正确的置信程度(degree of belief )。代理人这个词使相关定义与真
实结果的可能性关联在一起——科学对那些不会影响真实世界的个人的
沉思并不感兴趣。“置信”(belief )意味着人和主观。它是由多种多样
的影响确定的——只有问题中的代理人完全确定它。贝叶斯理论者并不
试图深究或者评判代理人的“置信”的起源。
但是贝叶斯理论想要量化置信的“程度”。那么该如何测量相信的强
度呢?除非它导致某种外界可辨识的行为,否则你不可能测量到。将定
性的估计转化为数字等同于将赌博形式化。这样看来代理人的身份很像
一个赌徒。在这场“赌博”中,我们暂且不管他是如何做出决定的,但是
他愿意拿出赌注的多少可以用来刻画他对某件事可能发生的概率的估
计。因此概率理论又回到了赌博和博弈游戏。为了使赌博的过程更标准
化,而且能够保证这样测量出的概率对应着0和1之间的实数(或者百分率),为了定义贝叶斯概率,我们先做出下面这些假设:赌博当事人都
有一些债券,并且约定当某一事件E 发生时,债券的卖方须给买方1元
钱。一旦赌徒都同意事件E 的准确的定义,他们就可以自由交易债券。
如果一个人认为某件事E 一定会发生,例如,太阳在明天会升起来,那
么他将这件事发生的概率赋值为1。于是他肯定愿意用低于1元钱的任意
价格买下债券(为什么要低于1元?这是因为如果他用1元买下债券,那
么他不可能盈利,这是一个愚蠢的选择)。相反,如果他觉得事件E 不
会发生,例如,他的咖啡杯在他松手后会飘浮在天花板上,那么他将赋
值概率为0,同时不购买债券。
类似步骤可以推广到那些既不是完全确定也非不可能的事件。例
如,抛硬币这个例子,代理人在学校学到或者根据他自己的经验知道得
到正面向上(这个例子中的事件E )的概率是12,因此他最多愿以0.5
元的价格买一张债券。如果硬币是正面朝上,那么他会获得1元,这样
他就净赚0.5元或者更多。相反,如果是反面朝上,那么他就损失了购
买债券的钱。
有了这些背景我们就可以介绍贝叶斯概率正式的定义。代理人对某
事件E 发生的概率赋值为p 意味着他最多愿意以p 元的价格购买一张债
券,如果事件E 发生,那么债券值1元。相反,代理人也愿意以高于或
者等于p 元的价格卖出一张债券。
和频率论的概率一样,这样定义的概率取值在0和1之间(包括0和
1)。虽然它们外在有相似之处,但是这两种定义相去甚远。对于在某
种传统中长大的人,往往都很难完全转向新的观点。不像更换一个新牙
刷那么轻易,对概率新奇的理解不可能一夜间取代旧的观念。因此,虽
然量子贝叶斯理论并没有给物理学带来暴风雨般的影响,但是目前也没
有什么能阻碍它的发展或能够立刻排除它。在许多科学与技术领域,贝
叶斯概率作为可靠有效的工具已经充分体现了它的价值,量子贝叶斯理
论则将成果扩展到量子力学的领域。包括我在内的很多物理学家在第一次遇到贝叶斯概率时通常都会大
吃一惊。谈论“置信程度”似乎和物理学传统的观念完全不相容。物理学
家往往都会觉得“自然伟大的定律”与主观意识或者个别代理人的信赖毫
不相干。相反,频率主义虽脱离现实世界,却成为枯燥无味的学术演讲
和课本中的基本内容。贝叶斯理论认为概率能预言单个事件的观测量,频率论者则拒绝接受,他们认为,当为将来的行为做决定时,概率是不
相关的。当我看到天气预报说今天下午会有70%的概率下雨时,其实并
没有告知我下午一定会发生什么,天气预报并没有帮助我决定是否带雨
伞或者什么时候离开家。事实上,天气预报确实是有用的,可以将70%
的预测理解为我对下午会发生的事情的“置信程度”,而且天气预报确实
影响了我的决定。
如果将物理学看作人类史诗般的冒险而非收集一些枯燥的事实,那
么物理学家也需要不断地做出决定,而且他们的决定是基于已有置信程
度。每次评估数据,每次开始新的计算,实验中的每次决定、每次争论
和每次下结论,旅途中的每一步都需要在许多选择中做出决定。对单个
事件的概率的估计在其中起到重要作用。
贝叶斯概率和频率论的最大区别莫过于概率的变化。个人的置信程
度的变化也就意味着赋予概率的值也会不同。频率论概率一旦定义就不
再会变化,抛硬币就是最好的一个例子。但是贝叶斯概率则与人的思想
有关,是可以不断变化的。因此除了帮助做决定外,贝叶斯概率也会不
断地修正。这种可塑性也正是贝叶斯概率起初的出发点。当获得了新的
证据,修改了之前的置信程度时,贝叶斯概率就会发生相应的变化,贝
叶斯定理就是反映概率变化的数学描述(回想一下上一节中对那个赌徒
我为何改变自己的主意)。
设想你知道或者假设某个特定事件发生的概率的大小,之后你偶然
获得了新的相关的信息,例如,一个新的实验结果或者一些不可预料的
新内容。贝叶斯定理告诉你的正是下面这个问题的答案:新的信息是如何改变你的概率估计的?
贝叶斯定理的价值在于它数学上的严格性。概率即置信度,和“事
实”不同,它是可塑的。但是概率和新的信息怎么组合在一起产生一个
修正的概率呢?这个步骤由数学公式决定,和勾股定理一样直接且毋庸
置疑。
下面举个例子来说明这个定理。设想有一种癌症,在大众中发病率
为0.5%,也就是说平均两百个人中有一个人患有该病。再假设一项新的
血液化验能以99%的准确度检测你是否患有此病。医生怀疑你患有此
病,因此采集了你的血液样本,并送去检测。几天以后,他打电话告诉
你化验结果已经出来,是阳性。
那么你确实得了这种癌症的概率是多少呢?你应该对此有多担心
呢?考虑到这种化验是十分可靠的,你是否应该设想最坏的结果?此时
你是否应该通知朋友和家人?你是不是应该再去做其他的测验?你又该
如何通过合理评估自己的机会来平复自己越发焦虑的心情?是否存在微
弱的希望——你并没有得癌症,只是化验结果是错误的,通常称之为假
阳性?
贝叶斯定理提供给我们一种有序的方法来思考这些问题。它涉及四
种不同的概率,每一种都可以表示为0和1之间的数字或者百分比。我们
将新的信息,即化验结果为阳性,记成加号+,这个问题中的事件E ,即你确实患有该病,记为一个表情符号L 。“阳性的结果意味着你确实
患有癌症”这句话的置信度对应的数字记为p (+→L)。这就是你应该寻求
的数字,这个概率左右着你的感觉。
第二种贝叶斯定理涉及下面这个事件的概率:给所有人都做了这种
化验,且结果都为阳性。我们将它记为p (+)。
我们还需要第三种概率,记为p (L ),它对应着做测验前你得癌症的概率。这只是开始我们提到的这种癌症在大众中的发病率,即0.5%。
第四种概率是整个计算中的关键。我们将它记为p (L →+)。或许你
已经从记号中看出,它在某种程度上是第一种概率的反转。它对应“你
确定自己患有这种癌症,化验结果为阳性”的概率。注意,不是“如果我
的化验为阳性,那么我确实患有这种癌症的概率是多少”,而是“如果我
确实得了癌症,那么化验结果是阳性的概率是多少”混淆这两类问题会
产生很多误会。“大多数罪犯都是男性”和“大多数男性都是罪犯”这两个
表达的意义是完全不同的,那两个问题的区别也与此类似。
现在我们已经有了贝叶斯定理的构件。贝叶斯定理就是下面这个简
单的等式。
p(+)×p(+→L)=p(L)×p(L→+)
直观地看,它非常容易理解。将上面的概率写成百分比的形式,它
表达的是一个显然的事实。在所有人中,找出化验结果为阳性的人p
(+),在这些人中再筛选出那些确实得了该癌症的人p (+→L )。或者,你
可以用另外一种方式,先选出那些确实得癌症的人p (L ),在这些人中
再筛选出化验结果为阳性的人p (L →+)。两种不同的方式你最终筛选出
来的都是同一群人,即那些得了该癌症且测量结果为阳性的人。
下面我们用具体数字计算。
这种癌症的发病率为p (L )=0.5%。等式右边的第二项p (L →+)估
算的是一个人得了该癌症,化验结果为阳性的可能性。由于这个化验是
如此的可靠,可以用p (L →+)≈100%作为很好的近似。当你的医生打
电话告诉你坏消息时,正是这个数字引起你的焦虑。知道这个化验是几
乎百分之百的准确,大多数人直觉上都会感到阳性的化验结果几乎肯定
意味着确诊患有该癌症。但是他们都错了!最诡异的是公式中的p (+),它反映的是在人群中做化验后结果
为阳性的概率。0.5%的人确实患有该癌症,因此他们的化验结果极有可
能为阳性。但是健康人群(整个人群的绝大多数)中的1%会不幸得到
一个错误的化验结果——假阳性,因此整个人群的化验结果为阳性的比
例p (+)≈1.5%。
将上面的数字带入等式,左右两边同时除以p (+)。那么在知道
你的化验结果为阳性时,你患病的概率为p (+→L )
≈0.5%×100%1.5%=100%3≈33%。(注意中间一步分子分母中出现的两
个%消掉了)。贝叶斯定理告诉你患病的概率只有大约13。统计数据告
诉你患该病的概率是0.5%,而化验结果本身则暗示你患病的概率是
100%,但贝叶斯定理的结果则是一个合理的折中。真叫人宽慰!你需
要明智地再做一次化验。由于不太可能恰好两次都是假阳性,重复化验
会极大地降低不确定性——更好的结果或者更坏的结果。
图2.2下面这个被奇怪分割的饼状图描绘的是群体数为1万人的真实统计
数据,从中你可以得到(大概)的百分比。被标记49和99的那两部分都
是化验结果是阳性的人群。由于你在这两类中的其中一种内,但是你并
不知道在哪个人群中(见图2.2),因此你患病的概率是13,这正是贝
叶斯定理预言的结果。对于更一般的情况,+可以用I 代替,意思是新的
信息,表情符号L 用E ,意思是某事件。做了这些替换之后,再将等式
两边同时除以P (I ),我们就得到了贝叶斯定理的常见的形式:
p(I→E)=p(E)×p(E→I)p(I)
在某种程度上来说,这两个条目组成了汉堡的牛排和芝士,而另外
两个则组成了汉堡的小面包。等式右边第一项p (E )指没考虑新的信
息I 时事件E 发生的概率。由于这个原因p (E )也被称为先验概率
(prior probability )。有时它只是开始不知情状况下的一个猜想,我们
期待着反复使用贝叶斯定理可以不断改善它。等式左右边的p (I →E )
指事件E 在获取新的信息I 之后修正过的新(或者后验)概率。另外两
项则影响着修正过程。通过简单的规则不断修正先验概率是贝叶斯概率
的核心
[3]。
在上面那个癌症例子中,接到医生的电话之前你自己对患病概率的
估计——先验概率——是0.5%。知道化验结果之后,你担心自己患病概
率几乎上升为100%,这也是不正确的。贝叶斯定理显示这个概率被修
正为33%。
贝叶斯定理的强大之处在于它能够将不同来源的信息组合起来。频
率论除了对一些均匀的数据集合外很难做到这一点。上面的例子中先验
概率源于人群中大规模的统计研究,然而癌症化验的准确性大概是基于
一些特定的临床试验。贝叶斯定理的计算不仅可以利用一些数据资料,甚至历史或者直觉都能帮助代理人选择先验概率然后不断修正。上一节
那个会堂中的赌徒例子,据说他连续100次都是正面向上,因此我才会决定不和他赌博,这说明了现实生活中引入新的信息并改变相应的概率
估计是非常有用的,只要把概率定义为置信程度。
相比于频率论,贝叶斯理论更普遍,逻辑清楚,且用途广泛,因此
它渐渐被接纳为概率基本的解释。气候学对唯一的大气层做出预测,需
要从各种各样的来源收集证据和信息,贝叶斯概率理论则是经常被用到
的数学工具。其他学科,包括社会科学、生物学、药学和工程学,都在
用贝叶斯概率。频率论中简单的公式“事件发生次数除以总试验次数”可
以得到概率的数值,但是贝叶斯理论提供了这些数字的真正的含义。下
面这个测量一张奇怪形状纸的面积的例子能展现测定和定义的本质差
别:虽然面积可以通过纸的重量(单位:克)除以密度(单位:克平
方米)得到,但面积的含义是完全几何的,与重量和密度无关。
前面我们已经知道,量子力学在根本上也是依赖于概率的,让我们
拭目以待,当贝叶斯概率遇上量子力学会碰撞出什么火花?
[1] 英文Bayes’是Bayes’s和Bayes折中后的形式。
[2] 可参考W.T.Eadie,D.Drijard,F.E.James,M.Roos,and B.Sadoulet,Statistical Methods in
Experimental Physics(Geneva,Switzerland:CERN,1971)。
[3] 需要指出的是,当先验概率是0或者1时,新的信息并不会改变它。第三章 量子贝叶斯理论
第11节 量子贝叶斯理论使事情明晰
就像水面宽阔的河流在流向大海的过程中是通过吸收很多小溪小河
逐渐变大一样,科学也在兼收并蓄着各种新的数据和知识的细流中前
进。形成鲜明对比的是,量子贝叶斯理论则是汇聚了两条大的支流。21
世纪初,作为一门古老而又复杂的学科,量子力学和始于18世纪、最近
复兴的数学分支——贝叶斯概率结合起来,形成各种已经确定的知识的
汇集。量子贝叶斯理论的创造者既没有创造Q 也没有发明B ,而是将它
们结合在一起,不仅对量子力学本身,而且对一般的科学世界观也有着
深远的影响。
量子贝叶斯理论的基本论点很简单:量子概率是个人置信程度的数
值衡量。
如果你不曾听过贝叶斯概率,那么这个命题看上去会很奇怪。科学
的整个关键不就是排除主观性而支持一般性吗?难道信念不是知识的对
立面,因而也是科学的对立面吗?这是在看到发表于2012年的量子贝叶
斯理论奠基文章时大部分物理学家的反应,也是在闻知它的时候我的感
受。这篇文章开门见山地在文章名字“量子概率作为贝叶斯概率”中宣告
了它那令人吃惊的结论。
从频率论转换到贝叶斯概率的解释,这个决定是源于某种成本效
益的分析。一方面,询问下面这个问题是很公平的:在这个变化中你得
到了什么?另一方面,它的副作用是什么?采取这种飞跃的代价是什么?
采用量子贝叶斯理论的代价并没有它看上去那么大,因为贝叶斯理
论有充分的根据。以个人对打赌胜算来解释概率,尽管对大部分人来说
最初会感到不安,但是它不仅比频率概率更早,也在大部分不相同的领
域中逐渐被越来越多的科学家和工程师采用。它已经存续了数个世纪,且在数不清的重大应用中都经受住了检验。对它熟悉之后,它就一点也
不奇怪了。
从积极的方面说,量子贝叶斯理论提供了相当多的益处,其中最令
人信服的莫过于解决了令人烦恼的波函数塌缩问题。在传统量子力学
中,波函数塌缩的直接原因一直悬而未决。它在时间与空间中是如何发
生的,并没有数学描述,而在经典物理中,其他的每一个过程都有这种
描述。力学的、电的、磁的、光的、声的以及热的扰动是如何从一个点
传播到另一个点,以及影响附近和远处的物体,都能以非常严谨的数学
方程展现出来。即使将我们束缚在一起的引力效应,也可以通过广义相
对论烦琐的数学方程,从我们这里开始逐步地到达某个星体然后再传播
回来理解。但是波函数的塌缩依旧是不可思议的,如同扎在数学物理中
的一根刺。
量子贝叶斯理论轻松而且优雅地解决了这个问题。在任何实验中,计算好的波函数为随后的实证观测提供了先验概率。一旦做出观测,比
如,粒子留下痕迹,探测器有撞击,确定自旋方向,操作实验的代理人
就获得了新的信息。利用这些信息,代理人只是瞬间地更新它的概率以
及波函数,并没有什么神奇的事情。塌缩去除了它的神秘之处。贝叶斯
定理描述了这个过程,并最终使失去的这部分显现出来。
实现这个过程的方式是如此直观。考虑一个例子:在纽约的爱丽
丝,拿起两张扑克,一张黑的,一张红的,并将它们装进两个独立的无
标记的信封中,密封好后重新洗牌。为了确保它们不可区分,她也让鲍
勃去洗牌。她保留一个信封在她手袋中并将另一个交给鲍勃。然后爱丽丝前往澳大利亚,在她打开信封之前,相信鲍勃拥有红牌的概率是
50%。一旦抵达澳大利亚,只要打开她自己的信封,她就会知道一万两
千英里之外的鲍勃的信封中装的是什么,这时她的置信程度就瞬间变成
了100%或0。同时,不论爱丽丝手中是什么,鲍勃关于爱丽丝手中卡牌
颜色的猜测不会因她的行为而改变。这里没有什么奇迹发生。
量子波函数的塌缩遵循着相同的逻辑,但是有一个很重要的区别。
在经典的例子中,由始至终,因果链都不曾被打破。一个客观物体,以
被密封在信封中的卡牌的形式,在爱丽丝的手袋中携带着信息。卡牌就
像一个神秘的信使——物理学家所称的携带着一些红值或黑值的隐变量
(hidden variable )的一个例子。在经典物理中,爱丽丝的无视掩盖了
这个值,但是原则上,她可以在旅途中任何时间打开信封,从而得到这
个值。在量子力学中,信封中没有卡牌,没有客观的机制去携带秘密信
息,也没有隐变量。甚至在原则上,我们也没有办法弄清电子在哪里,以及在它被撞击和被探测到这段时间内它自旋的指向。事实上,隐变量
不存在是可以而且已经在实验中证实的一个断言,我们将在下文中得到
这个结论。
当我开始理解量子贝叶斯理论时,以及意识到仅仅通过给概率一个
更好的定义,我就可以不用再苦苦思考波函数塌缩的意义了,我突然有
一种释放并且接近于愉悦的感觉。“当然,”我对自己说道,“这就是它
如何运作的。”这是一种不期而遇且不应有的启蒙的美好感觉,也是我
个人的那种“啊,有了”的时刻。
就像将波函数塌缩解释成简简单单的概率更新是不够的,量子贝叶
斯理论完成了另外一个同等有意义的澄清。在1961年,恰好是我开始职
业生涯的时候,量子力学先驱之一尤金·魏格纳(Eugene Wigner,1902
—1995)指出了一个量子力学基础上的模糊之处,它被熟知为魏格纳的
友人悖论(paradox of Wigners’friend ),它也可以被等价称为“总之,它是谁的波函数”?魏格纳和他的朋友一起做实验,并且他们都同意一个电子自旋可以由一个自旋向上和向下叠加态的量子位波函数描述。实
验运行后,计数器记录结果。他的朋友读取计数器,而魏格纳背对着仪
器,直到知道实验结束。他的朋友知道波函数已经塌缩到自旋向上的结
果。另外,魏格纳知道测量已经结束但是不知道结果。如之前那样,他
所分配的波函数是两个可能结果的叠加,但是现在他将电子的量子位和
计数器的读数以及他朋友对读数的信息联系在一起,而这个信息魏格纳
却不知道。
那么,谁是对的?量子位已经塌缩,还是仍处于叠加态中?只要波
函数作为一种真实的东西,或者一个真实过程的描述,那么这个问题将
不比柏克莱主教(Bishop Berkeley)那关于树在森林里的臭名昭著的问
题简单:当一棵树在森林里倒下时,并没有人听到,那么它是否发出声
音了?答案已经争议了3个世纪,并且还在继续引发争论。爱因斯坦思
考事情总是通过自己思考而不是依赖权威,也曾以不同的方式表达过相
同的问题。他的同事——恩斯特·帕斯夸尔·约尔丹(Ernst Pascual
Jordan)追忆道:“我们经常讨论他关于客观实在的见解。我记得在一次
散步时,爱因斯坦突然停住,转身问我是否相信月亮只有我们在看它的
时候才存在?”魏格纳的友人的问题,即谁的波函数和谁的概率分配是
对的?揭示了概率这个词的含义,并且它如同柏克莱的问题一样饱受争
议。
但是对于量子贝叶斯理论者而言,这些都不是问题:魏格纳和他的
朋友都是对的。每一个人分配的波函数反映了他们所能得到的信息,且
既然他们各自编辑的信息不同,他们的波函数也就不同了。只要魏格纳
自己看一下计数器或者从他朋友那里听到结果,他可以用新的信息更新
他的波函数,然后两个人在塌缩的波函数这个问题上就再次一致了。
当下面的疑问提出的时候,魏格纳的友人的问题就出现了:谁是对
的?换句话说,什么是正确的电子波函数?根据量子贝叶斯理论,没有
一个独一无二的波函数。波函数并不是被束缚在电子上的,也不是像圣徒头上萦绕的光环那样一直伴随左右——它们是由代理人分配的并且依
赖于代理人所能得到的信息。简而言之,波函数以及量子概率是贝叶斯
型的。
这个简洁的声明——量子贝叶斯理论宣言,如果你愿意这么叫的话
——足够短甚至可以将它印在T恤上,但是却带来了思考世界的新方
式。第12节 量子贝叶斯理论拯救薛定谔的猫
薛定谔的猫也许是这个世界上最有名的猫了,但不是所有的物理学
家都喜欢它。我曾经参加了斯蒂芬·霍金(Stephen Hawking)的一个报
告,报告中他用他的声音合成器呆板而有节奏地喊道:“当我听别人说
起薛定谔的猫时,我就会拿起我的枪。”量子贝叶斯的先驱克里斯同样
不喜欢这个动物,并且告诉我,他总是更倾向于担忧魏格纳的友人。这
只猫也是它名气的受害者。流行文化总是用许多误解、嘲弄和彻底无意
义的内容包装这个故事,以至于物理学家对它避而远之。它已有80多岁
的高龄,但由于它仍能够有效地阐明观点,我将再次使它复活。
这里是设置:一只活着的猫和由一个盖革计数器(Geiger
counter),被中子撞击而产生辐射的原子,一把锤子,以及一小瓶毒药
组成的鲁布·哥德堡装置,被封闭在一个盒子里面。当原子衰变时,就
像它最终会发生的那样,盖革计数器嘀嗒一声,并且释放一个电子信
号,而这个信号可以触发锤子,它会锤碎小瓶子,释放出毒气,而毒气
会马上无痛地杀死猫(见图3.1)。图3.1
问题是物理学家如何描述这个实验?一个辐射的粒子是与一个由量
子位所代表的波函数联系在一起的,而量子位的北极由0标记,代表着
原来的态,而南极由1标记,代表着衰变的态。从波函数推断得到的概
率以一个熟知且一直减少的速率平滑地从0态下降到1态。经历原子的半
衰期之后,量子位到达了球的赤道处,即50%原来的态和50%衰变的态
混合。如果此刻你观测原子,那么你将有50%的概率发现它衰变了。
根据传统量子力学的解释,即在薛定谔创造他的猫的时候所流行的
观点,注意到量子位的值是(除了极点)“0和1”的混合这点很重要。它
不是“0或1”。杨的经典双缝实验极其着重地展示了这点。为了使干涉出
现,光必须通过两个双缝而不是其中一个或另一个。采用同样的记号,量子位球上的一个点不是代表着二选一而是这个问题中量子事件的可能
结果的叠加。量子干涉效应就像肥皂泡上的颜色一样实在而且可观测,并且我们所知的能够描述它们的方式是“既……又”形式的叠加。
迄今为止,所有这些都是传统量子力学且无可争辩的。无数的实验
已经展示了这是描述辐射原子的正确方式。问题出在当你从原子上产生
干涉变成猫本身的干涉。假设你并没有打开箱子,在原子半衰期之后,猫的状态是什么?猫的命运和原子立刻联系在了一起——“纠缠”是薛定
谔引入英语的一个令人回味的词。一个完整的原子意味着活着的猫,一
个衰变的原子意味着死亡的猫。这看上去就像遵循着如下规律,既然原
子的波函数是毫无疑问地处于叠加,那么猫的状态也是:它既是死的又
是活的。一旦你打开箱子,那么这个悖论就消失了,猫就像常识所述的
那样,要么死要么活。但是只要箱子没打开,猫同时是死的和活的这个
奇怪的断言又是怎么回事呢?
薛定谔捏造了这个故事,目的是将量子奇异从单个原子以及它们的
波函数的模糊性带入到人类日常经验中。他试图戏剧化描述出两个不同
领域之间的差别。在过去90年间出现了很多关于量子力学的其他解释,发展这些的很多动力都是源于数学上阐明这个猫的处境。
量子贝叶斯理论如同处理波函数塌缩的奇迹以及魏格纳友人的悖论
那样毫不费力地处理了这个故事。这张图不是疆域图!原子的波函数并
不是对原子的描述。描述原子的量子位,是一个特定代理人对将来观察
的打赌胜算的置信程度的概括——不多也不少。在原子被观测前,它的
状态是数学上定义的而不是我们观察之后所用的。根据量子贝叶斯理论
的观点,一个未被观测的原子,或者一枚量子硬币,或者那件事中的猫
的态,是没有一点价值的。量子位球赤道上的一个点不是现实世界中任
何一个东西的符号——它仅仅代表着预测将来观察结果的概率的一个抽
象的数学表达式:0或1,未衰变或衰变的,死亡或生存。
宣称猫是死的和活的如同在硬币仍然在空气中翻腾时宣称硬币既是正面也是反面,以及赛马开始前宣称马赢了和输了一样毫无意义。概率
论总结了转动的硬币的状态,给它分配结果是正面的概率为12。赛马
场上的计数板列出了各匹马赢的概率。同样地,量子贝叶斯理论拒绝描
述箱子被打开前猫的状态,并且将它从盘旋在生与死的监狱中解救了出
来。
远在量子贝叶斯理论诞生之前,描述这个结论的一个难以忘记的方
式在1978年就被理论物理学家阿瑟·佩列斯(Asher Peres,1934—2005)
明确表达出来了。他注意到,像薛定谔的猫那样的故事中涉及一个“要
是”(what if)的问题:要是我们能在盒子仍关闭着时看这只猫呢?佩
列斯得出结论,量子力学不允许“要是”问题,并且创造了引人注目的口
号:“没有完成的实验没有结果。”经典物理当然允许在箱子打开前想象
箱子里有什么。这个经典思想实验的结果是猫是死的或者活的。在量子
力学,有一个定义完好的方式描述系统处于两个可能状态中的一个,0
态或者1态。这种描述的数学工具是一个经典比特——信息技术中通用
的拨动开关。但是对于一个辐射原子的波函数来说,比特是不够的。在
量子力学中取代比特的量子位在测量发生前没有值。用比特而不是量子
位描述原子将会导致与实验很直接的冲突。
佩列斯的构想实质上就是意义深远的量子贝叶斯理论的精神。就像
量子贝叶斯理论主张的那样,假如波函数除了告诉将来实验结果的概率
之外并没有透露关于原子或者任何其他量子力学客体的信息,那么代理
人甚至不会有兴趣过早地推测原子和猫的状态。在箱子打开之前未完成
的观测盒子的实验并没有结果,即使是推断性的结果。
根据量子贝叶斯理论的解释,原子和猫纠缠的波函数并不意味着猫
是死的和活的。相反,它告诉代理人当打开箱子时,他能合理地期望发
现什么。第13节 量子贝叶斯理论的根源
尽管量子贝叶斯理论是21世纪的革新产物,但它的根源却可以追溯
到古希腊原子论者。生活在公元前4世纪的德谟克利特(Democritus)教
导道:“甜是依照惯例而言的 ......
您现在查看是摘要介绍页, 详见PDF附件(2061KB,152页)。





