重复决策中的概率匹配行为及其认知机制*
个体,情境,1引言,2认知启发式,1联结学习启发式,2多样化的策略,3启发式策略的评价,3老练的策略,1自下而上的推断,2基于模型的探索,3老练策略评价,4概率匹配行为的应用,5总结与展望
34(1.四川理工学院教育与心理科学院,自贡 643000;2.西南大学心理学部,重庆 400715;3.重庆脑科学协同创新中心西南大学分中心,重庆 400715;4.中国基础教育质量协同创新中心西南大学分中心,重庆 400715)
1 引 言
日常生活中的很多决策问题大多具有重复的性质,常常需要在相同或相似的情境下做选择。例如司机决定开车是否系安全带,企业决定是否在年度税务报告中做“手脚”,医生判断某种症状是否应被诊断为癌症。一般意义上讲,理性的决策者在面临上述决策问题时,应当每一次都采取价值最大化的最优策略。例如,当司机认为系安全带对自己更有利时,他/她应当始终采取系安全带的措施。然而大量研究表明,人类决策者在面对重复性决策问题时,并不总是做出对自身最有利的行动。
在经典的概率学习任务中,被试需要预测两个互斥的随机事件,例如猜测红绿两只灯泡哪只会亮。每次预测时,红和绿出现的概率分别为0.3和0.7,并且概率值在整个实验中保持不变。理性人应该始终猜测绿色,该策略平均正确率为0.7;然而实际研究中,多数决策者更倾向于采取概率匹配(probability matching)的策略,即大致以3∶7的比例猜测红和绿。该策略的平均正确率只有0.7×0.7+0.3×0.3=0.58,因而是次优的。概率匹配行为已被大量实验研究重复(见综述Hardy-Vallee,2007;Koehler & James,2014;Vulkan,2000)。此外,在人类知觉决策(Murray,Patel,& Yee,2015)、概率推断(Acerbi,Vijayakumar,& Wolpert,2014)、抽象规则的学习(Craig,Phillips,Zaldivar,Bhattacharyya,& Krichmar,2016)、注意的空间分配(Geng et al.,2013)等研究领域中也都发现了类似的行为模式。
早期的观点认为,概率匹配行为是一种次优的非理性行为(见综述Vulkan,2000)。然而,根据司马贺(Simon,1990)提出的有限理性(bounded rationality)原理,由于认知能力的局限,人类并不总够获得所有问题的最优解,因而在对个体行为做出评价时,应当充分考虑决策者的认知能力及其所处的具体环境。在评价概率匹配行为时,同样应该考虑到环境因素。实验室条件下的重复决策问题大都是静态(static)的,具有时间独立(temporal independence)的性质(Haselton et al.,2009) ......
您现在查看是摘要页,全文长 15900 字符。