自然场景的识别及其理论模型*
加工,信息,1前言,2自然场景识别的主要特征,1自然场景识别的快速性,2自然场景识别的低耗能性,3场景识别的特异性脑区及其神经机制,4自然场景识别的理论模型,1自然场景识别的认知模型:前馈模型与反馈模型,2自然场景识别的计算模型
(浙江大学心理与行为科学系,杭州 310028)1 前 言
自然场景(nature scene)是指由空间分布合理的背景和离散的客体构成的真实环境的连贯图像(Henderson & Hollingworth,1999)。以往研究发现,人类对场景图片的信息提取和处理能力非常出色。我们既能够对快速呈现的自然场景图片中的客体信息进行辨认和命名(Potter,1976;Thorpe,Fize,& Marlot,1996;LoBue & Deloache,2008),也能够对快速呈现的不同类别的自然场景图片进行分类(Torralbo et al.,2013),还能够快速探测自然场景中的深度信息、场景功能等社会信息(Gajewski,Philbeck,Pothier,& Chichka,2010;Greene & Oliva,2009)。人类视觉系统如此高效快速的自然场景识别能力引起了相关领域研究学者们的广泛兴趣。
本文首先总结并详细地阐述了人类视觉系统在处理自然场景时的主要特征,然后结合新近的认知神经科学研究,系统地介绍关于自然场景识别的特异性脑区及其简要关系。在此基础上,文章进一步整理了以往研究者针对自然场景识别所提出的认知模型和计算模型,论述各个模型对自然场景识别领域的贡献和不足,以助于未来自然场景识别领域的相关研究。
2 自然场景识别的主要特征
2.1 自然场景识别的快速性
人们能够从复杂的自然场景中准确快速地提取场景的主题(gist)信息。
一方面,人类可以迅速准确地从众多干扰刺激中识别目标刺激。早期研究发现,当场景图像以每秒8张的速度进行快速序列呈现(rapid serial visual presentation,RSVP)时,即使在序列开始呈现之前只给被试有关目标场景主题的简单文字描述,他们也能准确地识别出目标刺激(Potter,1975)。Potter等人(2014)将RSVP的实验条件设置为每张场景图像呈现13~80ms,连续呈现6或12张,然后要求被试判断描述的目标场景是否出现在呈现序列中。结果发现,即使在呈现时间最短的13ms条件下,无论关于目标场景的描述是出现在序列呈现之前还是全部呈现完成之后给出,被试对目标检测的准确率都显著高于随机水平,说明即使刺激只呈现13ms,被试也能够对序列中的所有刺激进行快速加工。
另一方面,人类能够快速地提取自然场景中的有效信息,并做出正确选择。Thorpe等人(1996)采用经典的go/no-go动物分类范式 ......
您现在查看是摘要页,全文长 21938 字符。