语义在人脑中的分布式表征：来自自然语言处理技术的证据

http://www.100md.com 2023年12月29日心理科学进展 2023年第6期

    摘" 要" 人脑如何表征语义信息一直以来是认知神经科学的核心问题。传统研究主要通过人为操纵刺激属性或任务要求等实验方法来定位语义表征脑区，这类方法虽然取得了诸多成果，但是依然存在难以详细量化语义信息和语境效应等问题。基于语义的分布式假设，自然语言处理(NLP)技术将离散的、难以客观量化的语义信息转变为统一的、可计算的向量形式，极大提高了语义信息的刻画精度，提供了有效量化语境和句法等信息的工具。运用NLP技术提取刺激语义信息，并通过表征相似性分析或线性回归建立语义向量与脑活动模式的映射关系，研究者发现表征语义信息的神经结构广泛分布在颞叶、额叶和枕叶等多个脑区。未来研究可引入知识图谱和多模态融合模型等更复杂的语义表示方法，将语言模型用于评估特殊人群语言能力，或利用认知神经科学实验来提高深度语言模型的可解释性。

    关键词" 语义表征，大脑，自然语言处理，语言模型

    分类号" B842

    1" 前言

    语言作为一种抽象符号，是人类进行意义表达和信息交流的最重要的工具。基于有限数量语言单位的组合，人们可以理解和表达无穷多的信息，包括但不限于知识、信念、意图、情感等。揭示人脑如何存储、通达与提取语义一直是认知神经科学的核心问题之一。为了探究语义表征和加工的神经基础，研究者通常采用的思路是操纵刺激属性或任务要求，对比不同条件下脑活动模式的异同。例如，在词汇判断任务中对比真词与假词激活脑区的差异(Pulvermüller， 2013); 或对于相同语言刺激，对比语义与语音判断任务的脑活动差异(Poldrack et al.， 1999)。基于严格实验控制和条件间对比的研究范式取得了一系列重要成果，然而在探究语义的脑表征与加工问题上存在以下局限。

    第一，对语义特征的刻画依赖人工评定，且颗粒度较粗。日常生活中交流情境复杂多变，但人们只需掌握少量的词语即可满足言语交流需求，例如在汉语中590个字就已经覆盖了80%的日常用字(中华人民共和国教育部， 2013)。有限的文字能够组合成无限的意思，其原因在于人们对每一词汇都构建了丰富的心理表征，不同词汇在多个维度上存在微妙差异 ......

百拇医药网 http://www.100md.com/html/paper/1671-3710/2023/06/009.htm

您现在查看是摘要页，全文长 70565 字符。