计算机化分类测验终止规则的类别、特点及应用*

http://www.100md.com 2022年5月16日心理科学进展 2022年第5期

置信区间,贝叶斯,1引言,2似然比规则,1序贯似然比方法(SPRT),2广义似然比方法(GLR),3似然比规则简评,3贝叶斯决策理论规则,1阈值损失,2线性损失,3贝叶斯规则简评,4置信区间规则,1置信区间规则介绍

     任赫黄颖诗陈平

    ·研究方法(Research Method)·

    计算机化分类测验终止规则的类别、特点及应用*

    任赫黄颖诗陈平

    (北京师范大学中国基础教育质量监测协同创新中心, 北京 100875)

    计算机化分类测验(Computerized Classification Testing, CCT)能够高效地对被试进行分类, 已广泛应用于合格性测验及临床心理学中。作为CCT的重要组成部分, 终止规则决定测验何时停止以及将被试最终划分到何种类别, 因此直接影响测验效率及分类准确率。已有的三大类终止规则(似然比规则、贝叶斯决策理论规则及置信区间规则)的核心思想分别为构造假设检验、设计损失函数和比较置信区间相对位置。同时, 在不同测验情境下, CCT的终止规则发展出不同的具体形式。未来研究可以继续开发贝叶斯规则、考虑多维多类别情境以及结合作答时间和机器学习算法。针对测验实际需求, 三类终止规则在合格性测验上均有应用潜力, 而临床问卷则倾向应用贝叶斯规则。

    计算机化分类测验, 终止规则, 似然比, 随机缩减, 贝叶斯决策理论

    1 引言

    由于能够改变传统纸笔测验中相对固化的试题形式、更深刻地体现“因材施测”和“高效施测”, 计算机测验尤其是计算机化自适应测验(Computerized Adaptive Testing, CAT)近年来得到飞速发展。对于CAT而言, 其测验目的一般是准确估计被试能力, 而计算机化分类测验(Computerized Classification Testing, CCT)——作为CAT的一个重要分支——则以分类考生为目的。具体来说, CCT在CAT的基础上可以根据预设的分界分数将被试划分到两个(比如, 掌握和未掌握)或多个(比如, 合格、良好和优秀)不同的类别中。相比于传统纸笔测验, CCT的优势在于：首先, CCT不仅可以自适应地呈现最适合被试作答的题目, 还可以在保持相同决策精度的情况下大大缩短测验长度(Spray & Reckase, 1996), 进而降低测验成本、减少被试疲劳效应的影响; 其次, CCT依托于计算机施测的特点使其能够为被试呈现更加丰富的测验内容和题目形式(比如交互式测评), 并获取更多元细致的被试数据; 再者, CCT的高效计算力使得更精细测量模型和算法的使用成为可能, 比如融入过程性或多模态数据的模型(Sie et al., 2015; Zhan et al., 2021)以进一步满足各种测验需求、提升分类决策的可靠性 ......

百拇医药网 http://www.100md.com/html/paper/1671-3710/2022/05/018.htm

您现在查看是摘要页，全文长 32424 字符。