基于3PLM和GRM混合模型的等值方法比较
主观题,测验,1引言,2研究方法,1数据来源,2等值设计与方法,3等值步骤,4比较基准和标准,3结果与分析,1测验观察分数等值结果,2误差平均差的方差分析,4讨论,5结论
黎光明(华南师范大学心理学院、心理应用研究中心,广州 510631)
1 引言
等值是心理与教育测量领域的一个重要组成部分,是测验标准化过程中的一个必备程序(漆书青,戴海崎,丁树良,2002)。具体而言,测验等值是指将测量同一心理品质的多个测验形式上的测验分数或项目参数的单位系统进行转换,以达到相互间对应指标可比的过程。进行等值处理后,同一考生在不同测验版本上的得分相同。一般来说,进行等值必须满足四个前提条件,即同质性、等价性、样本一致性及对称性(张敏强,1998)。
在题库的建设中,项目参数估计和等值是两个突出的技术问题。传统的基于经典测量理论的等值方法只能实现不同试卷之间的等值,而随着项目反应理论(Item Response Theory,IRT)在心理与教育测量领域越来越广泛的应用 (黎光明,张敏强,2012),基于IRT的等值方法实现了将试题的难度、区分度、猜测水平等题目参数置于同一尺度上,从而满足大规模题库建设的需要。
按照项目反应理论,同一项目在不同的单位系统上虽然参数值的数字表现形式不同,但实质却一样。假设有两个测验X和Y,且两测验有M个锚题,同一项目的两套参数间必然存在如下的线性转换关系 (Sayaka & Shinichi,2011; Kolen & Brennan,2013):


在公式(1)~(4)中,A 和 B 为线性转换参数(等值常数),θxi,axj,bxj,cxj表示在群体 x 上估计出的参数,θyi,ayj,byj,cyj为在群体 y 上估计出的参数。除非另外有申明,一般假设 i=1,2,…,N;j=1,2,…,M。
上述这些公式反映了在项目反应理论模型下,不同单位系统的各种参数之间的等值转换模式,A和B为等值转换系数。
在项目反应理论的指导下,研究者建立了众多的计量模型,这些模型都有各自的特点和所适用的范围。在实际的应用过程中,研究者往往会根据情况进行选择以达到模型对数据的最佳拟合。在实际的研究工作中我们常常会遇到一份测验材料既有0-1评分的多重选择题 (Multiple-Choice items ......
您现在查看是摘要页,全文长 13287 字符。