认知诊断模型资料拟合检验方法和统计量*
被试,测验,题目,1引言,2CDM项目拟合检验统计量,1基于传统卡方检验的拟合统计量,1.1统计量,1.2Q1统计量,1.3PD统计量,1.4统计量,2基于后验预测模型检查(PPMC)方法的统计量,2.1简单相关系数,2
陈 孚 辛 涛 刘彦楼 刘 拓 田 伟(1北京师范大学心理学院;2北京师范大学中国基础教育质量监测协同创新中心,北京 100875)
(3曲阜师范大学中国教育大数据研究院,曲阜 273165)(4天津师范大学教育科学学院,天津 300384)
1 引言
作为新一代测验理论,认知诊断理论在过去的几十年间成为了测量学界研究的热点。认知诊断评价结合了认知心理学理论和统计模型,通过被试在测验中的实际作答反应获得被试在所考察的认知技能(或称之为“属性”)上的掌握情况,从而实现对个体知识结构、加工技能或认知结构进行诊断评估(Leighton&Gierl,2007)。通过认知诊断模型(cognitive diagnosticmodels,CDM s)对测验数据的分析,被试可获得其知识或技能掌握情况的精细化报告,使用者也可达到形成性和诊断性评价的目的(Embretson,1998;Tatsuoka,1983)。据统计,现有的认知诊断模型多达100多种(辛涛,乐美玲,张佳慧,2012),这些模型对所考察属性与作答反应关系的假设往往是不同的。对于认知诊断实践而言,如何从众多模型中选择合适的模型?又如何评价所选的模型与数据之间的匹配程度?模型资料拟合检验能够为这些决策提供重要的参考指标。
和其它统计模型的拟合检验类似,CDM拟合检验可分为三个方面:模型资料全局或整体拟合检验(global/overallmodel-data fit)考察在整体水平上模型是否良好匹配数据,项目拟合(item fit)检验考察测验中的部分项目是否拟合所选模型,个人拟合(person fit)检验考察参加测验的被试是否适用于所选模型。需特别说明的是,CDM对被试的诊断分类应基于Q矩阵被正确界定的前提下进行,因此对Q矩阵正确性的检验也应纳入CDM拟合检验的一部分,但由于篇幅有限,且Q矩阵的修正和估计方法内容丰富,已有相关综述发表(刘永,涂冬波,2015),本文在此略去。拟合检验的另一种分类方式是相对拟合检验和绝对拟合检验,前者用于多个模型对同一批数据的拟合情况比较,从而通过最优的拟合指标选择最适用于分析和诊断的模型,后者用于考察某个特定的模型与数据的拟合情况。
然而,传统的基于卡方的拟合检验方法不适用于CDM,这是由CDM的特性及卡方检验的使用条件所决定的(Rup p,Tem p lin,&Henson,2010)。卡方检验必须遵循的应用条件为足够大的样本量,以确保在列联表中每个单元格的期望频数不少于5(Agresti&Finlay,1997) ......
您现在查看是摘要页,全文长 41001 字符。