如何用SAS软件正确分析生物医学科研资料XXIII.结果变量为多值有序变量的高维列联表资料的统计分析与SAS软件实现(一)
鲍晓蕾,王璐,胡良平当观测结果是定性资料时,人们习惯将资料整理成列联表形式。比如“2×2 列联表资料”、“R×C 列联表资料”和“高维列联表资料”等。所谓高维列联表,也就是表中涉及到的定性变量的个数 k ≥ 3。对于高维列联表资料,根据结果变量的性质可将其分为以下三类:一是结果变量为二值变量的高维列联表;二是结果变量为多值有序变量的高维列联表;三是结果变量为多值名义变量的高维列联表。本文将详细介绍结果变量为多值有序变量的高维列联表及其用SAS 软件实现统计分析的内容。
对于结果变量为多值有序变量的高维列联表可使用CMH 校正的秩和检验或有序变量多重 logistic 回归分析等统计分析方法。对数线性模型无法考察资料的有序性,因此不宜选用。若采用 CMH 校正的秩和检验,应注意结合待考察的原因变量是否为多值有序变量而选择合适的统计量;若采用有序变量多重 logistic 回归分析,应注意结合原因变量中是否存在多值名义变量或多值有序变量而决定对原因变量的赋值方法。本文将详细介绍 CMH 校正的秩和检验。
CMH 检验作为扩展的 MH 检验,从一定意义上讲,是一种概括统计方法,它在考虑控制分层因素影响的前提下,根据 R×C 表格中行变量与列变量,即原因变量与结果变量属性的不同,给出三种检验统计量。当行变量与列变量均为多值有序变量时,可选择非零相关统计量;当行变量为名义变量而列变量为多值有序变量时,可选择行平均得分统计量,也称为方差分析统计量(注:有别于定量资料方差分析);当行变量与列变量均为名义变量或行变量是多值有序变量而列变量为名义变量时,可选择一般关联统计量。
下面以简表形式表示第 h 层的 R×C 表(表 1),h =1、2 …… q。q 为层数(即分层因素的水平数),R 为行数,C 为列数。
上表中 nhij表示第 h 层第 i 行第 j 列所对应的频数;nhi+为第 h 层第 i 行的合计数,i = 1、2 …… R;nh+j为第 h 层第 j 列的合计数,j = 1、2 …… C;nh为第 h 层的合计数。根据上表可以得到第 i 行对应的概率为 Phi+=nhi+/nh,第 j 列对应的概率为 Ph+j= nh+j/nh ......
您现在查看是摘要页,全文长 8493 字符。