对计数资料进行统计检验的探讨
作者:包和平 刘兰真
单位:内蒙古蒙医学院数学教研室 通辽028041
关键词:
数理医药学杂志990422 计数资料是将每个观察单位按其性质分类,然后清点各种性质观察单位数量的资料,如治疗结果的治愈、好转、恶化或死亡例数等。研究两组(或几组)率或构成比情况间的差别是否有显著意义,可以用卡方检验。这类资料都可以列成表格,有2×C列联表,R×G列联表,表内的数据是实际观察数据,称为实际数。实际数与理论数差异的大小用χ2值的大小来说明。实际数与理论数的相对差异越大时,χ2值也越大。同时每一对理论数与实际数的差数也加入χ2值中。分组越多,即格子越多,χ2值也会越大。所以在考虑χ2值的大小和意义的同时,要考虑列格子数。当格子多时,这种方法特别灵敏,容易作出差别有极显著意义的结论。特别是对等级分组计数资料更灵敏。如临床疗效分为痊愈、显效、好转、无效,检验结果以“-”、“+”、“”、“”、“”等等级分组。这些资料可以列成2×C列联表,或R×G列联表,实际工作中人们习惯用χ2检验。但是,等级分组资料至少分3列4组,由于格子多易得出极端结论,且χ2检验法本身不能说明对比各组的疗效优劣,仅能说明比较各组的构成比是否相同。在此情况(等级分组的计数资料)比较理想的方法是Ridit统计分析法。
, 百拇医药
Ridit分析的主要特点是能够将等级资料经过一种特定的变换,转化成连续型资料,并服从均匀分布。由概率知识可知其平均值的分布将是一个正态分布。于是可按u检验的原理,在给定显著水平α后,估计出它的置信区间,这个区间应该与理论区间重叠。如果实际算出不重叠,则说明在显著水平α上差异显著,反之,则说明不显著。此外,Ridit分析能分出哪组优,如用近似法作Ridit分析,则十分简便。下面通过实例予以说明。
例 用甲、乙两种疗法治疗某种疾病,其结果见表1,试分析甲、乙两种疗法有无显著性差异。
表1 用甲、乙两种疗法治疗某种疾病疗效对比 治疗结果
甲 法
乙 法
例数
%
, 百拇医药
例数
%
治愈
10
20.0
15
30.0
显效
20
40.0
5
10.0
好转
, http://www.100md.com 5
10.0
20
40.0
无效
15
30.0
10
20.0
合计
50
100.0
50
100.0
, 百拇医药
1 运用卡方检验分析
自由度:f=(R-1)(C-1)=(4-1)(2-1)=3
查χ2临界值表χ2=11.345。由于χ2>χ20.01,P<0.01,说明两种疗法的差异极显著。如何判定哪种疗法效果好呢?χ2检验不能明确回答。由表1的构成比来看,两种疗法好象无太大的差别。为什么差异又极显著呢?因为这是等级分组资料不适合于用χ2检验,另外格子多本身就使χ2值变大。
2 用Ridit检验法分析
, 百拇医药
表2 用甲、乙两种疗法治疗某种疾病疗效对比 治疗结果
(1)
甲法
(2)
乙法
(3)
合计f1
(4)
f1/2
(5)
f1累计移下行
(6)
, http://www.100md.com
(5)+(6)
(7)
R1=(1)/N
治愈
10
15
25
12.5
12.5
0.125
显效
20
5
, http://www.100md.com
25
12.5
25
37.5
0.375
好转
5
20
25
12.5
50
62.5
0.625
, http://www.100md.com
无效
15
10
25
12.5
75
87.5
0.875
以各等级Ridit作标准,分别计算两样本Ridit值的均数R1、R2。
R1=(10×0.125+20×0.375+5×0.625+15×0.876)/50=0.5
R2=(15×0.125+5×0.375+20×0.625+10×0.875)=0.5
, http://www.100md.com
N=100,R=0.5
因R1、R2值服从正态分布,故可按两组均数的u检验法:
给定α=0.01时,说明甲、乙两法差异不显著,符合客观规律。
3 用正交试验法分析
将表1归纳成表3因素水平表表3 因素水平表
A
B
1
, 百拇医药
治愈
甲法
2
显效
乙法
3
好转
4
无效
R=maxKi-minKi i=1,2,3,4
按总自由度加1计算:
fA+fB+1=(4-1)+(2-1)+1=5
, http://www.100md.com
最少试验组数应为5,在混合型正交表中选L0(4×24)表,将表1的8组数据全部安排上,见表4。表4 试验安排及结果分析 试验号
A
A×B
B
例数
1
1
1
1
1
1
10
, 百拇医药
2
1
2
2
2
2
15
3
2
1
1
2
2
5
, 百拇医药
4
2
2
2
1
1
20
5
3
1
2
1
2
20
, 百拇医药
6
3
2
1
2
1
5
7
4
1
2
2
1
15
, http://www.100md.com
8
4
2
1
1
2
10
K1
25
50
30
60
50
T=100
, 百拇医药
K2
25
50
70
40
K3
25
K4
25
R
0
0
40
, 百拇医药
20
0
4 试验结果分析
由表4所示,列2、列3、列4不能作为误差估计列,因为列3的R最大,说明疗效和疗法存在相互影响,根据表4K值可以列出表5。表5 疗法与疗效关系的分析 疗法
疗 效(%)
A1治愈
A2显效
A3好转
A4无效
B1甲法
, 百拇医药
23
30
20
27
B2乙法
27
20
30
23
由表5可知,甲法治愈、显效、好转、无效例数无明显差异。其总有效率为73%。乙法治愈、显效、好转、无效例数也无明显差异,其总有效率为77%。再由表4列5的R所示,甲、乙疗法的病例在数量上无明显差异,两种疗法没有显著差异。
, 百拇医药 用正交法检验计数资料可以不考虑数据是否按等级分组,且分析的结论可靠。
正交试验法的特点是从全面试验设计的整体着眼,在安排试验时,又是利用正交表的均衡分散特性,从整体试验中挑选部分代表性强的试验点进行试验。在做试验结果分析时,由于正交表具备整齐可比特性,所以可以不直接比较试验结果的好坏,而是通过水平试验值的大小,对各因子主次和水平的好坏作出分析。
参考文献
1 于立芬,郑世光.数理统计方法.上海科学技术出版社,1984.
2 徐吉民.正交法在医药科研中的应用.中国医药科技出版社,1987.
收稿日期:1999-01-05, 百拇医药
单位:内蒙古蒙医学院数学教研室 通辽028041
关键词:
数理医药学杂志990422 计数资料是将每个观察单位按其性质分类,然后清点各种性质观察单位数量的资料,如治疗结果的治愈、好转、恶化或死亡例数等。研究两组(或几组)率或构成比情况间的差别是否有显著意义,可以用卡方检验。这类资料都可以列成表格,有2×C列联表,R×G列联表,表内的数据是实际观察数据,称为实际数。实际数与理论数差异的大小用χ2值的大小来说明。实际数与理论数的相对差异越大时,χ2值也越大。同时每一对理论数与实际数的差数也加入χ2值中。分组越多,即格子越多,χ2值也会越大。所以在考虑χ2值的大小和意义的同时,要考虑列格子数。当格子多时,这种方法特别灵敏,容易作出差别有极显著意义的结论。特别是对等级分组计数资料更灵敏。如临床疗效分为痊愈、显效、好转、无效,检验结果以“-”、“+”、“”、“”、“”等等级分组。这些资料可以列成2×C列联表,或R×G列联表,实际工作中人们习惯用χ2检验。但是,等级分组资料至少分3列4组,由于格子多易得出极端结论,且χ2检验法本身不能说明对比各组的疗效优劣,仅能说明比较各组的构成比是否相同。在此情况(等级分组的计数资料)比较理想的方法是Ridit统计分析法。
, 百拇医药
Ridit分析的主要特点是能够将等级资料经过一种特定的变换,转化成连续型资料,并服从均匀分布。由概率知识可知其平均值的分布将是一个正态分布。于是可按u检验的原理,在给定显著水平α后,估计出它的置信区间,这个区间应该与理论区间重叠。如果实际算出不重叠,则说明在显著水平α上差异显著,反之,则说明不显著。此外,Ridit分析能分出哪组优,如用近似法作Ridit分析,则十分简便。下面通过实例予以说明。
例 用甲、乙两种疗法治疗某种疾病,其结果见表1,试分析甲、乙两种疗法有无显著性差异。
表1 用甲、乙两种疗法治疗某种疾病疗效对比 治疗结果
甲 法
乙 法
例数
%
, 百拇医药
例数
%
治愈
10
20.0
15
30.0
显效
20
40.0
5
10.0
好转
, http://www.100md.com 5
10.0
20
40.0
无效
15
30.0
10
20.0
合计
50
100.0
50
100.0
, 百拇医药
1 运用卡方检验分析
自由度:f=(R-1)(C-1)=(4-1)(2-1)=3
查χ2临界值表χ2=11.345。由于χ2>χ20.01,P<0.01,说明两种疗法的差异极显著。如何判定哪种疗法效果好呢?χ2检验不能明确回答。由表1的构成比来看,两种疗法好象无太大的差别。为什么差异又极显著呢?因为这是等级分组资料不适合于用χ2检验,另外格子多本身就使χ2值变大。
2 用Ridit检验法分析
, 百拇医药
表2 用甲、乙两种疗法治疗某种疾病疗效对比 治疗结果
(1)
甲法
(2)
乙法
(3)
合计f1
(4)
f1/2
(5)
f1累计移下行
(6)
, http://www.100md.com
(5)+(6)
(7)
R1=(1)/N
治愈
10
15
25
12.5
12.5
0.125
显效
20
5
, http://www.100md.com
25
12.5
25
37.5
0.375
好转
5
20
25
12.5
50
62.5
0.625
, http://www.100md.com
无效
15
10
25
12.5
75
87.5
0.875
以各等级Ridit作标准,分别计算两样本Ridit值的均数R1、R2。
R1=(10×0.125+20×0.375+5×0.625+15×0.876)/50=0.5
R2=(15×0.125+5×0.375+20×0.625+10×0.875)=0.5
, http://www.100md.com
N=100,R=0.5
因R1、R2值服从正态分布,故可按两组均数的u检验法:
给定α=0.01时,说明甲、乙两法差异不显著,符合客观规律。
3 用正交试验法分析
将表1归纳成表3因素水平表表3 因素水平表
A
B
1
, 百拇医药
治愈
甲法
2
显效
乙法
3
好转
4
无效
R=maxKi-minKi i=1,2,3,4
按总自由度加1计算:
fA+fB+1=(4-1)+(2-1)+1=5
, http://www.100md.com
最少试验组数应为5,在混合型正交表中选L0(4×24)表,将表1的8组数据全部安排上,见表4。表4 试验安排及结果分析 试验号
A
A×B
B
例数
1
1
1
1
1
1
10
, 百拇医药
2
1
2
2
2
2
15
3
2
1
1
2
2
5
, 百拇医药
4
2
2
2
1
1
20
5
3
1
2
1
2
20
, 百拇医药
6
3
2
1
2
1
5
7
4
1
2
2
1
15
, http://www.100md.com
8
4
2
1
1
2
10
K1
25
50
30
60
50
T=100
, 百拇医药
K2
25
50
70
40
K3
25
K4
25
R
0
0
40
, 百拇医药
20
0
4 试验结果分析
由表4所示,列2、列3、列4不能作为误差估计列,因为列3的R最大,说明疗效和疗法存在相互影响,根据表4K值可以列出表5。表5 疗法与疗效关系的分析 疗法
疗 效(%)
A1治愈
A2显效
A3好转
A4无效
B1甲法
, 百拇医药
23
30
20
27
B2乙法
27
20
30
23
由表5可知,甲法治愈、显效、好转、无效例数无明显差异。其总有效率为73%。乙法治愈、显效、好转、无效例数也无明显差异,其总有效率为77%。再由表4列5的R所示,甲、乙疗法的病例在数量上无明显差异,两种疗法没有显著差异。
, 百拇医药 用正交法检验计数资料可以不考虑数据是否按等级分组,且分析的结论可靠。
正交试验法的特点是从全面试验设计的整体着眼,在安排试验时,又是利用正交表的均衡分散特性,从整体试验中挑选部分代表性强的试验点进行试验。在做试验结果分析时,由于正交表具备整齐可比特性,所以可以不直接比较试验结果的好坏,而是通过水平试验值的大小,对各因子主次和水平的好坏作出分析。
参考文献
1 于立芬,郑世光.数理统计方法.上海科学技术出版社,1984.
2 徐吉民.正交法在医药科研中的应用.中国医药科技出版社,1987.
收稿日期:1999-01-05, 百拇医药