基于随机森林的认知诊断Q 矩阵修正
向量,数量,1引言,2现有理论与方法,1饱和CDM,2最新发表的传统修正方法:Wald-XPD法,3机器学习算法:随机森林,3基于随机森林的Q矩阵修正方法,4研究1:模型训练研究,1数据集生成,2特征提取,3模型训练与评估
秦海江 郭 磊,(1 西南大学心理学部,重庆 400715)
(2 中国基础教育质量监测协同创新中心西南大学分中心,重庆 400715)
1 引言
认知诊断评估(CDA)作为新一代的心理测量理论,与经典测量理论采用单一分数评价个体不同,认知诊断评估能够对个体的认知结构进行诊断分类,进而提供多维潜在特质(如技能、素养、人格特质等,统称为属性)的评价结果。认知诊断模型(CDM)是一类用于认知诊断评估的多维、离散潜变量模型,根据个体是否掌握某些属性将其诊断为不同类别(Nájera et al.,2021),并已广泛应用于心理、教育、医疗诊断等诸多领域(Sorrel et al.,2016)。Q矩阵是认知诊断的核心要素(de la Torre &Chiu,2016;Tatsuoka,1983),它描述了测验中题目与属性之间的关系(Tatsuoka,1990),对诊断分类的准确性至关重要(刘彦楼,吴琼琼,2023)。错误界定的Q矩阵会极大降低认知诊断模型参数估计的精度和被试诊断分类的准确性,得到较差的模型数据拟合结果(de la Torre,2008;Gao et al.,2017;Im &Corter,2011)。目前,Q矩阵通常是领域专家采用文献查阅、理论分析和口语报告等经验方法构建(Nájera et al.,2020),但这些方法较为主观(Yu &Cheng,2019),并且在实证应用中,Q矩阵也常被指出包含一定的错误界定(Chiu,2013;Li &Suen,2013;Rupp &Templin,2008)。因此,如何界定准确的Q矩阵是认知诊断评估研究中面临的现实难题。
为了获取准确的Q矩阵,研究者尝试使用被试的观察作答数据估计Q矩阵,如Chung(2019)使用蒙特卡洛马尔可夫(MCMC)算法可以较为准确地估计Q矩阵。但是该方法在属性较多、人数较少时准确性会大幅下降,且程序的修订时间较长,通常运行一次蒙特卡洛马尔可夫算法需要耗费12小时,时间成本过大(Chung,2019)。实际上,更多的研究者对专家预先构建的Q矩阵进行了修正,并提出了许多Q矩阵修正方法(李佳等,2021)。根据适用性,这些修正方法可大致分为适用于简化认知诊断模型和适用于饱和认知诊断模型两类。适用于简化认知诊断模型的修正方法,如δ法(de la Torre,2008)、残差法(RSS;Chiu,2013)、迭代修正序列搜索算法(IMSSA;Terzi &de la Torre,2018)、极大似然估计与边际极大似然估计(Wang et al.,2018)、RMSEA法(Kang et al.,2019)、残差统计量法(Yu &Cheng.,2019)和ORDP法(李佳等,2022)等 ......
您现在查看是摘要页,全文长 30273 字符。