如何用SAS软件正确分析生物医学科研资料XXII. 结果变量为二值变量的高维列联表资料的统计分析与SAS软件实现(二)
对数,线性,1对数线性模型,2多重logistic回归分析
鲍晓蕾,胡良平如何用SAS软件正确分析生物医学科研资料XXII. 结果变量为二值变量的高维列联表资料的统计分析与SAS软件实现(二)
鲍晓蕾,胡良平
100850 北京,军事医学科学院生物医学统计学咨询中心
编者按
生物统计学是生物学领域科学研究和实际工作中必不可少的工具,在分子生物学迅速发展的今天,生物统计学更显示出了它的重要性。实验设计与数据统计分析是现代生物学的基石,是生物学研究者检验假说、寻找模式、建立生物学理论的有利工具,也是生物学研究者探索微观和宏观生物世界的必备基础知识。对于每天甚至是每时每刻涌现的大量的、以天文数字计量的分子遗传数据,必须借助统计学知识加以分析处理,才能从中获得有意义的信息。“生物多样性数据分析”是开展生物多样性研究的一个重要方面,数据分析能力的高低极大地影响着我们对各种生态学现象认识的深度和广度。现在,电子计算机的普及使得生物统计分析过程大大简化,生物统计分析软件包的普及将生物统计学从统计学家的书本里解放了出来,简化了生物统计分析过程,使之成为生物学研究者的常用工具。本刊特邀军事医学科学院生物医学统计学咨询中心主任胡良平教授,以“如何用SAS软件正确分析生物医学科研资料”为题,撰写系列统计学讲座,希望该系列讲座能对生物医学科研工作者有所帮助。
当观测结果是定性资料时,人们习惯将资料整理成列联表形式。比如“2′2 列联表资料”、“R′C 列联表资料”和“高维列联表资料”等。所谓高维列联表,也就是表中涉及到的定性变量的个数≥ 3。对于高维列联表资料,根据结果变量的性质可将高维列联表分为以下三类:一是结果变量为二值变量的高维列联表;二是结果变量为多值有序变量的高维列联表;三是结果变量为多值名义变量的高维列联表。在上一期中,我们已经介绍了用CMH2检验和加权2检验处理结果变量为二值变量的高维列联表资料,本文将继续介绍结果变量为二值变量的高维列联表资料的其他分析方法及 SAS 实现。
处理不同的高维列联表资料所用的统计分析方法不尽相同,对于结果变量为二值变量的高维列联表资料可使用 CMH2检验、多重 logistic 回归分析、对数线性模型等统计分析方法。本文重点介绍对数线性模型和多重 logistic 回归分析如何处理结果变量为二值变量的高维列联表资料。
1 对数线性模型
在上一期中,我们介绍了用 CMH2检验和加权2检验来处理结果变量为二值变量的高维列联表资料,这两种方法的本质都是控制其中一个原因变量对结果的影响,从而分析另一个原因变量的作用 ......
您现在查看是摘要页,全文长 11699 字符。