评估零效应的三种统计方法
先验,贝叶斯,等价,1引言,2等价检验,贝叶斯估计和贝叶斯因子的原理,1等价检验,2贝叶斯估计的原理,3贝叶斯因子的原理,3等价检验,贝叶斯因子的应用和比较,1实例1:KitchenRolls,2实例2:Sociometricstat
许岳培 陆春雷 王 珺 宋琼雅 贾彬彬 胡传鹏(1.中国科学院行为科学重点实验室(中国科学院心理研究所),北京 100101;2.中国科学院大学心理学系,北京 100049;3.浙江师范大学心理与脑科学研究院,金华 321004;4.中山大学心理学系,广州 510006;5.上海体育学院心理学院,上海 200438;6.南京师范大学心理学院,南京 210024)
1 引 言
原假设显著性检验(Null hypothesis significance test,NHST,也翻译为零假设显著性检验或者虚无假设显著性检验)是目前使用最为广泛的统计推断方法。在NHST框架下,研究者通常在假定原假设(null hypothesis,H)为真的前提下,根据p 值是否小于预先设定的α(如:α=0.05)来决定是否拒绝原假设(Wasserstein&Lazar,2016)。若基于当前数据计算得出的p 值小于预先设定的α,则认为当原假设为真时,在一次抽样中出现当前结果(及更极端结果)的可能性非常小,那么研究者就有理由拒绝该原假设。由于NHST 的理论前提是假定原假设为真,这就意味着,p 值大于α 的结果(即统计意义上不显著的结果)并不能作为支持原假设的证据(Greenland et al.,2016;Wasserstein&Lazar,2016)。因此,当研究者将零效应(nil effect,“效应量为零”或者“效应不存在”)作为原假设(这样的原假设又称零假设,nil hypothesis) 时,无法通过NHST 和p 值来评估零效应。
实际研究中,研究者经常需要评估零效应(Linde,Tendeiro,Selker,Wagenmakers,&Ravenzwaaij,2020)。例如,研究者欲证实某干预方法的非劣性,即欲证实新兴的、更为经济的治疗方案相对于常规治疗方案同样有效。又如,在一些实验组/控制组匹配的研究设计中,研究者需要对无关变量进行匹配(如:两组被试的性别、年龄),即希望通过统计推断得到“两组被试来自同一总体”的结论。此外,许多理论会预测在某些情况下某效应不存在,此时证实该特定情况下的零效应可为这些理论提供支持。
另一类常见的情况是,研究者发现基于收集到的数据未能拒绝欲推翻的原假设(即意外的p>0.05 的结果),或是在进行探索性研究(未有明确的研究假设)时发现p>0.05 的结果。此时,研究者要进一步区分是“证据不足”(null of evidence,即由于统计效力低下等其他原因未能探测到本应存在的效应)还是“效应不存在”(evidence of null ......
您现在查看是摘要页,全文长 25017 字符。