变量相对重要性评估的方法选择及应用*
因变量,回归系数,贝叶斯,1引言,2变量相对重要性的评估指标,1相关系数与回归系数,2R2增量,3Shapley值,4优势分析,5共性分析,6相对权重分析,7变量重要性指标的比较与选择,3变量相对重要性的统计推断,1频率统
朱 训 顾 昕(华东师范大学教育心理学系,上海 200062)
1 引言
在当前心理学研究关注高维度大数据的背景之下,研究涉及的变量越来越多,变量的重要性评估变得越发重要。例如,个人、家庭、学校、社会层面的诸多因素都可能影响学生校园欺凌行为。简单来说,变量重要性表示其在预测和解释因变量时的贡献。相对重要性评估能够帮助研究者探索、验证和细化理论。比如家庭因素和学校因素哪一个对于校园欺凌行为的影响更大,在家庭因素中亲子互动关系、父母管教方式、父母情绪处理等变量的重要性排序又是怎样的。相对重要性评估对变量的有效利用格外重要。首先,探索变量的相对重要性能够帮助决策者确定投入的重点。尽管师生关系、教师对待欺凌的态度、校园文化、班级大小等因素都会影响校园欺凌行为,但在资源和时间有限的情况下,管理人员可能不得不选择更具成本和时间效率的项目,例如是开发课程帮助学生认识校园欺凌还是加强教师处理欺凌事件技巧的培训更为迫切。此外,评估变量的相对重要性能够帮助决策者确定需要接受干预的个体。如果确定个体的自尊水平、身体表征是校园欺凌行为发生的重要因素,就可以预先识别出可能涉及欺凌事件的高危学生群体并进行早期介入,避免或减少欺凌行为的发生。因此,变量相对重要性的方法与应用研究具有重要的现实意义。
变量相对重要性的研究是从回归模型开始的,Darlington (1968)在Psychological Bulletin期刊的文章最早讨论了相对重要性的评估指标,包括相关系数、偏相关系数、标准化回归系数等,但都被证明存在明显缺陷。后来,心理学研究者提出了优势分析(Budescu,1993;Azen & Budescu,2003)、相对权重(Johnson,2000)等相对重要性评估指标,并给出了相对重要性的一般定义:同时考虑单独效应与偏效应时,每一个自变量对R2(回归模型测定系数,coefficient of determination)的贡献比例(Johnson & LeBreton,2004)。这些指标的含义和计算方法不同,适用情境也不尽相同。
许多应用相对重要性方法的实证研究只汇报了各变量重要性指标的估计值和由此得到的排序,而忽略假设检验的结果。但是,假设检验是统计推断的必要工作。在计算变量的相对重要性指标后,研究者最好利用假设检验推断变量相对重要性及其差异的显著性。例如,一个自变量的重要性是否显著地大于另一个自变量,或是否有足够的数据证据支持变量的重要性排序。研究者通常使用bootstrap 抽样方法计算指标估计值的标准误并构造置信区间(Azen & Budescu,2003;Tonidandel et al.,2009) ......
您现在查看是摘要页,全文长 31503 字符。