附录五分析流行病学有关计算(理论书籍)

附录五分析流行病学有关计算

http://www.100md.com 《流行病学》

附录五分析流行病学有关计算

(一)OR、ORMH 的可信限和ORi的齐性检验

⒈Miettinen法即是以显著性检验为基础的(test-based)可信限。计算ORMH的100(1-α)%可信限公式

(附式5-1)

此公式同样可用于计算单个OR(即从一张四格表数据算出的OR)的可信限。这时，上式中用OR代替ORMH，用x2代替X2MH 。匹配数据的OR也可同样计算。用函数型电子计算器来算，都很简单。

式中的U，可查标准正态差简表(附表5-1)，Uα/2可查α/2单侧检验的Uα值。最常用的95%可信限按下式计算(上限记为ORU，或 OR，下限记为ORL或OR):

(附式5-2)

(附式5-3)

附录5-1 标准正态差简表

α(或β)	单侧检验时Uα(或Uβ*)	双侧检验时Uα
0.001	3.09	3.29
0.005	2.58	2.81
0.010	2.33	2.58
0.025	1.96	2.24
0.05	1.64	1.96
0.10	1.28	1.64
0.20	0.84	1.28
0.30	0.52	1.04

*双侧检验时Uβ值与单侧检验时相同

计算实例：表4-4的数据，ORMHH=5.55，x2MH=76.84，95%可信限：OR=5.55(1+1.96/√x2MH)＝5.55(1+0.22)=8.09；OR=5.55(1-0.22)=5.550.78=3.81。

2. Woolf法即自然对数转换法

(1)首先把OR转移为自然对数，记为lnOR；

(2)按下式求出lnOR的方差，记为VαΥ(lnOR)：

即四格表中每一格数值的倒数之和。倘有某一格的数值为0时，可在每格的数值上各加0.5，再求出它们的倒数之和。

⑶lnOR的100(1-α)%可信限为

(附式5-4)

(附式5-5)

如为求95%可信限，上面两式中Uα/2=1.96；

(4)最后各取其反对数(eX)，即为OR的可信限。

(5)也可直接用下式算可信限：

(附式5-6)

(附式5-7)

以上都是用于计算不分层OR(粗OR)的公式，如为分层的数据也可用Woolf法计算各层lnORi的加权平均数及其可信限；同时可检验各层ORi是否有齐性，即是否没有显著差异，倘有齐性，计算总的OR才有意义。

计算实例：仍用表4-4的数据，用公式(附式5-4)与(附式5-5)分别算出吸烟者与不吸烟者两层中饮酒与食管癌的OR及其对数(lnOR)以及lnOR的方差和方差的倒数(wi权重)，结果列表如下：

层次	ORi	lnORi	VαΥ(lnORi)	wi
1	10.30	2.3321	+++＝0.1347	7.4239
2	3.70	1.3083	+++＝0.0723	13.8313

总的OR用下式计算：

(附式5-8)

将上表数据代入：

结果与ORMH(5.55)相当接近。再按下式求OR的标准误：

(附式5-9)

得Sx(lnOR)=0.2169,于是lnOR的95%可信限lnOR±1.96Sx,代入得2.09，1.24，于是

与ORMH的95%可信限(8.09,3.81)也十分接近。

但是各层的ORi相关悬殊，或即吸烟者与不吸烟者中饮酒与食管癌联系强度差异较大，这种差异是随机变异的机会有多大？可以用下式作x2检验：

(附式5-10)

式中k＝层数，自由度＝k-1。

代入本例数据，x2＝5.06，5.06>x2(1，0.025)，p<0.025，各层间的OR差异显著，来自同一总体的可能性很小，所以总的OR不能说明吸烟、饮酒与食管癌的联系，因此是无意义的。

上述x2检验同时可用来检验各因素间是否存在交互作用。本例的结果提示吸烟与饮食这两个因子与食管癌危险度的联系有交互作用。

以上两种方法算得的都是似可信限，但在OR靠近无效值⑴的情况下，特别是在样本较大时，近似法与精确法所得结果十分接近。

⒊匹配数据的OR可信限

可用Miettinen法〔以显著性检验为基础的方法，公式(附式5-1)〕，实例见第四章表4-11的数据分析。还可用下述方法：

(1)先算方差：

(附式5-11)

(2)OR 的(1-)%可信限

(附式5-12)

(附式5-13)

计算实例：仍用表4-11的数据，计算OR的95%可信限。Ua/2=1.96，OR=1.71，Var(lnOR)=(60+35)/(60×35)=0.0452，

结果与用公式(附式5-1)算得的(1.14，2.57)很接近，而且理论上更恰当。

(二)病例对照研究样本含量的估计

所谓样本含量估计是指在满足一定条件下的一个粗略估计数；条件变动时估计数会随之发生变化，所以只有相对意义，而不能看作是保证可达到目的的准确数值。

样本含量(n)的估计须根据①对照人群的预防暴露率，p0；②暴露与疾病的联系程度，以RR为指标；③假阳性率，即Ⅰ型误差，α；④假阳性率，即Ⅱ型误差，β。

1.非匹配设计病例数与对照数相等时每组所需人数

(附式5-14)

式中

Uα与Uβ可查附表5-1。有时也可不用公式，通过查表即可得n，例如附表5-2。

附表5-2 病例对照研究样本含量(非匹配，病例组与
对照组人数相等时每组需要人数)

α＝0.05(双侧)，β＝0.10
RR	p0
	0.01	0.05		0.1	0.2		0.4	0.5		0.6	0.8	0.9
0.1	1420	279		137	66		31	24		20	18	23
0.5	6323		1286	658		347	203	182	176		229	378
2.0	3206		689	378		229	176	182	203		347	658
3.0	1074		236	133		85	71	77	89		163	319
4.0	599		134	77		51	46	51	61		117	232
5.0	406		92	54		37	35	40	48		96	194
10.0	150		36	23		18	20	24	31		66	137
20.0	56		18	12		11	14	18	24		54	115