不同铆测验设计下多维IRT等值方法的比较*_误差

不同铆测验设计下多维IRT等值方法的比较*

http://www.100md.com 2013年2月3日心理学报 2013年第4期

误差,1引言,2多维IRT模型及等值方法,1两参数多维IRT模型,2多维IRT等值,3模拟设计,1混合实验设计,2数据生成,3参数估计和等值,4评价标准,4结果,1偏差,2绝对偏差和误差均方根,2.1等值方法的比较

     刘玥刘红云

    (1四川省教育科学研究所,成都 610225) (2北京师范大学心理学院,北京 100875)

    1 引言

    在大型的教育测验中,常常会出现考核同一个内容的多个测验形式,为了实现这些测验分数之间的比较,会用到测验等值的方法。根据等值所依据的原理,一般可以分为经典测验理论(CTT)下的等值方法和项目反应理论(IRT)下的等值方法(Kolen&Brennan,2004)。其中,IRT等值方法又以其理论完善,等值关系简洁,且题目参数具有跨群体不变性等优势,而受到广泛关注。在大多数的标准测验中,考生的能力参数和题目参数是由单维IRT模型(UIRT)估计得到的,因此,基于单维IRT模型的等值方法已经得到了较为深入的研究(Kolen&Brennan,2004)。

    然而,在现实情境里,测验通常会包含多维结构(Ackerman,1994;DeMars,2006;Reckase,1985)。在很多大型的教育评价项目中,对于一个概括性的能力的测量,通常会包含关于多个子学科(子能力)的题目。例如在关于学生科学能力的测验中,可能包含分别来自于物理,地理,生物等多个学科的题目。这时,传统IRT理论的单维性假设很容易遭到违背。基于单维IRT假设的参数估计和IRT等值结果会出现一定的偏差(Reckase,2009;Brossman,2010)。因此,许多研究者已经逐渐开展了对基于多维项目反应理论(MIRT)下等值方法的研究和探索。

    迄今,很多研究已经将单维IRT下的等值方法推广到多维结构中。这些方法主要有多维均值/均值方法,均值/标准差方法(Yao,2011),IRT相等函数方法,Stoking-Lord(测验特征函数)方法,Haebara(项目特征函数)方法,直接方法(Oshima,Davey&Lee,2000),LL方法(Li&Lissitz,2000),Min的方法(Min,2003),NOP方法(Reckase&Martineau,2004)和同时等值的方法(Simon,2008)等。这些方法和单维IRT等值方法的主要区别是,多维IRT等值不仅需要调整不同测验量尺原点和单位大小的差异,还要进行量尺旋转和维度相关调整等一系列过程(Reckase,2009)。这些方法之间的主要区别在于它们计算参数转换矩阵的原理和方法不同。一些研究还基于题目参数的返真性对多维IRT等值方法进行了比较(Davey,Oshima,&Lee,1996;Li&Lissitz,2000;Oshima et al.,2000;Yao&Boughton,2009) ......

百拇医药网 http://www.100md.com/html/paper/0439-755X/2013/04/009.htm

您现在查看是摘要页，全文长 27449 字符。