当前位置: 首页 > 期刊 > 《中国医药生物技术》 > 2013年第5期
编号:1224238
如何用SAS软件正确分析生物医学科研资料XXV.结果变量为多值名义变量的高维列联表资料的统计分析与SAS软件实现(一)
http://www.100md.com 2013年12月1日 中国医药生物技术 2013年第5期
对数,病患者,1CMHχ2检验1,2对数线性模型
     王琪,胡良平

    针对高维列联表(表中涉及到的定性变量的个数 k ≥3)资料的分析,前四期的讲座分别介绍了结果变量为二值变量的高维列联表和结果变量为多值有序变量的高维列联表资料的统计分析与SAS 软件实现,本文将详细介绍结果变量为多值名义变量的高维列联表资料及其用 SAS 软件实现统计分析的内容。

    分析结果变量为多值名义变量的高维列联表资料时,可以选用的统计分析方法有CMH χ2检验、对数线性模型和扩展的多重 logistic 回归分析,本文重点介绍前两种方法。

    1 CMH χ2 检验[1]

    在高维列联表中,当结果变量为多值名义变量时,选用一般关联统计量,也就是 FREQ过程 CMH 检验输出结果中的第三项,其自由度 ν=(R-1) (C-1)。它的具体计算公式可以参见本刊 2013年第 3 期,在计算该统计量时,行的评分阵 Rh与计算行平均得分统计量的行评分矩阵相同,即Rh=[IR-1,–JR-1];列的评分阵 Ch可以被类似地定义为:

    其中 IC-1是秩为C-1的单位阵,JC-1是元素均为1的(C-1)×1的列向量。在一般关联统计量中,行的评分阵 Rh与列的评分阵 Ch都是由 FREQ 过程内部产生的。

    一般关联统计量不要求原因变量或结果变量是有序的。无论原因变量是多值有序变量还是名义变量,只要结果变量是多值名义的,都可以采用该统计量。与之相对应的原假设和备择假设分别为:

    H0:每层中原因变量和结果变量之间不存在关联;

    H1:至少有一层,原因变量和结果变量之间存在某种关联。

    当仅有一层时,该 CMH 统计量与Pearson χ2统计量的关系为:

    其中 n 为总例数;当有多层时,该统计量为层修正的Pearson χ2统计量。当然,相似的校正也能够通过对各层Pearson χ2统计量求和而得到,但是这种校正方法需要每层的样本含量都要足够大 ......

您现在查看是摘要页,全文长 9340 字符