词素位置概率在中文重叠歧义词识别中的作用 *
词尾,1引言,2实验1:词素位置概率在含多音字的重叠歧义词识别中的作用,1被试,2实验材料和设计,3实验仪器,4实验程序,5结果,3实验2:词素位置概率在重叠歧义词识别中的作用,4讨论,5结论
曹海波 任 亮 韩 丹 贾东立 王敬欣(1 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院,天津 300387 ) (2 河北北方学院艺术学院,张家口 075000)(3 河北北方学院法政学院,张家口 075000) (4 天津师范大学心理学部,天津 300387)(5 学生心理发展与学习天津市高校社会科学实验室,天津 300387)
1 引言
视觉词汇识别是阅读活动的一个基本内容(Kliegl et al., 2004)。而词汇识别的前提是词切分,即识别文本中的语言符号并将其组合成不同层次的语言学单位(Li et al., 2009)。多数拼音文字词与词之间有空格,读者在视觉感知阶段可完成词切分。而中文无词间空格,相邻汉字可组成双字词、三字词、四字词等。缺乏词边界标记使中文词切分的方式具有多样性(Li et al., 2022),读者需借助内隐线索进行词切分。研究发现词素位置概率可作为读者词切分的依据(Liang et al.,2022)。词素位置概率是指汉字出现在词首或词尾时双字词的次数占该汉字组成的所有双字词的比重(Yen et al., 2012)。如,语料库中“铁”可组成59个双字词,出现在词首组成49个词,如“铁路”“铁链”等,其词首词素位置概率为0.83。可见,“铁”常居于双字词词首,这为读者提供了较为清晰的词边界信息。
词素位置概率是中文词汇的显著特点。拼音文字中组成单词的最小单位是字母。中文里词素常被定义为具备形态和语义的最小语言单位(赵思敏 等, 2017)。此外,中文大多是双字词,这使得词素位置信息明确,字符位置信息加工是中文词汇识别的重要环节(Gu & Li, 2015),当一些词素常出现在词首或词尾时,词素位置概率信息被提取。经统计,约8.2%的汉字常居于词首,7.5%的汉字常居于词尾(白学军, 闫国利,2017),读者在阅读过程中常接受这一固定位置讯息,加深了心理词典中字符居于词首或词尾的印象。梁菲菲(2013)操纵首、尾词素的位置概率,创设三种类型的假词作为新词,发现在词素位置概率一致条件下的注视时间显著低于不一致条件。另有研究发现,小学生运用词素位置概率帮助词切分的能力弱于大学生(连坤予 等, 2021)。词素位置的这一特性与中文词汇的加工方式有关,依据Li和Pollatsek(2020)的中文阅读模型,词汇识别是一个交互激活的过程,包含视觉信息、汉字层、词汇层,各层级单元间互有联系,且每类单元存在对应每个项目的节点。如汉字层,在每个位置都有可能被激活一系列对应的汉字节点 ......
您现在查看是摘要页,全文长 14698 字符。