交叉设计中顺序效应的影响及其分析方法
作者:张文彤 李晓松 倪宗瓒
单位:华西医科大学卫生统计学教研室 成都610041
关键词:临床试验;交叉设计;顺序效应;遗留效应
数理医药学杂志990408 摘 要 从模型定义出发,阐明常用的交叉设计分析方法及存在的问题,指出了顺序效应的重要性,提出了顺序效应的检验方法以及存在这一效应时的分析方法。
交叉设计是临床试验、尤其是新药试验中常用的一种试验设计方法,它能同时控制时间因素及个体因素对处理方式的影响,但如果在设计时考虑不周,则可能会存在偏倚,这一点往往为应用者所忽视。本文拟以计量资料的交叉试验设计为例,从模型定义出发,阐明现有交叉设计分析方法的缺陷,并就有关问题做进一步探讨。
以平衡的两阶段交叉设计为例,若研究A、B两种药物的疗效是否不同,则设两种顺序,即AB和BA,并将2n名实验对象随机分配到这两种顺序组中,AB组先接受A药,而BA组先接受B药,经过一段“效应去除时间”(washout time)后,AB组病人改用B药,BA组病人改用A药。这样每个病人都均匀的接受了两个阶段、两种药物的处理,在最大限度上平衡了各种非研究因素对结果的影响。显然,这些病人间唯一不同的因素是处理顺序,其中一半病人为AB顺序,而另一半病人为BA顺序,但在整个样本中这一因素是平衡的。
, 百拇医药
1 交叉设计的模型定义及顺序效应的实质
交叉设计的变异有以下几个来源:处理效应、阶段效应、顺序效应和个体差异。其中处理效应是想研究的因素,而顺序效应则在目前常用的统计分析中被忽略。标准的两阶段交叉设计可用如下模型表示[1]:
Yi(j)k=αik+Si(j)+εi(j)k
其中i、j、k分别代表顺序、个体和阶段;Yi(j)k代表测量结果;αik代表在顺序i阶段k时的总效应;Si(j)代表个体j在顺序i中的效应,并设其总体标准差为φ;εi(j)k为随机项,并假设其总体标准差为γ。若设平均效应为μ,阶段效应为ω=ωⅠ-ωⅡ,处理效应为τ=τA-τB,顺序效应为λ=λAB-λBA,则可进一步将αik按不同的周期和阶段分解如下:
, 百拇医药
阶段Ⅰ
阶段Ⅱ
AB顺序(i=1)
μ+τA+ωⅠ
μ+τB+ωⅡ+λAB
BA顺序(i=2)
μ+τB+ωⅠ
μ+τA+ωⅡ+λBA
其中τA和τB代表A、B两种处理的效应;ωⅠ和ωⅡ代表两个阶段的效应;λAB和λBA则代表了两种顺序的效应。顺序效应实质就是通称的遗留效应(carryover effect),即上一阶段的处理由于效应去除时间不足或其它原因干扰了下一阶段的处理效果。如果A、B两种药物均对下一阶段无影响或者影响相同,则AB与BA两种顺序的效应相等或相近,此时该效应混在阶段效应中,即可以忽略它的影响;如果A影响B,而B不影响A,或者A对B的影响不等于B对A的影响,则AB和BA两种顺序的效应不相同,此时就不能忽略其影响,且表现在第二阶段的处理效果中。按照其作用是减小还是增大了两种处理间的差别,可将遗留效应分为正遗留效应和负遗留效应两种,以正遗留效应最为多见。2 常用的分析方法及其问题
, http://www.100md.com
对于交叉设计的计量资料,现在通常采用的分析方法有:交叉设计的方差分析法、差值的方差分析等。
2.1 方差分析法[2] 这是应用最为广泛的一种方法,主要目的是检验处理效应是否存在。相应的H0为:τ=0,并且在分析时将顺序效应忽略不记。因此,两个顺序组可被看为同一个顺序组,其真正的H0假设可进一步变化如下[1]:
YⅠ1+YⅡ2-(YⅠ2+YⅡ1)=0
2μ+2τA+ωⅠ+ωⅡ+λBA-(2μ+2τB+ωⅠ+ωⅡ+λAB)=0
, 百拇医药
2(τA-τB)=λAB-λBA
τ=λ/2
可见,该假设检验只有当λ=0,即顺序效应不存在时才是适宜的。因此应首先进行顺序效应的检验,即Grizzle所提出的两阶段方差分析法[3]。
有的文献给出的方差分析法包括了对顺序效应的分解[4],并同时检验四种变异的来源是否有统计学意义。实际上,当存在顺序效应时,各F值中只有SS顺序/SS个体服从F分布,而SS处理/SS误差、SS阶段/SS误差均不再服从F分布[3];只有顺序效应不存在时,统计量F才均服从F分布,所求出的p值才是无偏的。因此,当顺序效应存在时,现有的方差分析法并不适用。
, 百拇医药
2.2 差数法 差数法是对每位受试者求出两阶段测量结果之差,然后检验两个顺序组的差值有无统计学意义。如果两种处理效果相同,则两顺序组的差值应该无区别。由于受试者间相互独立,并且阶段效应的影响完全相同,因此差值中只包括了顺序和处理两种变异。H0假设可进一步变换如下:
YⅠ1-YⅡ2-(YⅠ2-YⅡ2)=0
τA-τB+ωⅠ+ωⅡ-λAB-(τB-τA+ωⅠ-ωⅡ-λBA)=0
2(τA-τB)=λAB-λBA
, http://www.100md.com
τ=λ/2
可见,差数法的检验实际上与方差分析完全等价。同理,只有当顺序效应不存在时,该检验才能真正反映处理效应是否存在。
3 顺序效应的检验方法
上述分析方法的前提是不存在顺序效应,因此在分析中应首先对顺序效应做检验。常见的方法有3种:
3.1 图示法 即分顺序和阶段计算均值,再分别以阶段和结果变量为x、y轴绘图,在图上将相同药物的两点相连。如果不存在顺序效应,则两条直线应基本平行。此外,还可从图上初步判断哪种药物对下一周期有遗留效应。
3.2 和数法 即将每个受试者的两次测量结果相加,然后检验两顺序组有无统计学差异。由模型易知两顺序组只有顺序效应不同,可推导出其H0假设为λ=0,表明它的确是无偏估计。
, 百拇医药
3.3 方差分析法[4] 在分析时将资料看成类似裂区设计的形式,即顺序组为第一层,其余效应为第二层。这时对顺序效应的检验实际上相当于普通的成组设计,可按前面的方法推导出其H0假设亦为λ=0,实际上,这种方法与和数法完全等价。
4 顺序效应存在时的统计分析方法
由前面的讨论可知,当顺序效应存在时,目前常用的统计分析方法并不适宜。如果是正遗留效应,那么它的存在减少了两种处理间的差异,传统的方法相对较保守,但如果得出拒绝H0的结论,该结论仍是可信的;如果是负遗留效应,则此时必须采用其它分析方法,这正是交叉设计分析方法研究的难点。
4.1 只分析第Ⅰ阶段的数据[5] 从模型可知,顺序效应只存在于第Ⅱ阶段,因此用第Ⅰ阶段数据对处理因素所做的统计推断是无偏的。但这种方法存在检验效能的问题,分析第一阶段的数据只利用了一半的信息量,相当于成组设计,因此检验效能较低。可推导出在H0成立的前提下,处理效应的总体方差估计值γ2(1/n1+1/n2)/2,而只分析第Ⅰ阶段的数据,其总体方差估计值则为(φ2+γ2)(1/n1+1/n2),至少是前者的2倍以上,可见其检验效能下降了许多[1]。
, 百拇医药
4.2 采用其它新方法 近几年来,新的交叉设计分析方法层出不穷,但争议也较大[1,6~8],其中有以下几种方法认识较为一致:分类资料可以采用对数线性模型来分析;计量资料可采用多重分析法、贝叶斯分析法和校正的F检验分析。
5 讨论
5.1 一个理想的交叉设计应当根据药物的半衰期等情况设定相应的效应去除时间,同时还应采用双盲法,并用安慰剂做对照。此时顺序效应的影响很小,一般可采用传统的方差分析等方法来分析。但是在一些临床药物试验中,由于诸多因素使之不能完全采用上述措施,则各种未能完全去除的混杂因素综合表现为顺序效应的影响。在分析时就应首先考虑是否存在顺序效应,并在必要时采用多重分析法等方法来分析。
5.2 顺序效应常常被认为就是指药物残留效应(drug carry-over effect),实际上这只是最常见的一种。除此以外,还有心理效应(psychological carry-over effect)、第Ⅰ阶段用药导致耐药性而产生的撤退效应(withdravwal effect),以及病人身体状况因用药而改变所导致的遗留效应(nonuniform carry-over effect)等等[9]。它们均可通过合理的设计来去除(双盲 法可去除心理效应,适当的效应去除时间可去除大部分其他种类的顺序效应,安慰剂一般不会和有效药物产生相互作用)。
, http://www.100md.com
5.3 值得指出的是,现有的对顺序效应的检验方法并非十分完善,主要是检验效能较低。虽然Grizzle建议将α水准至少定为0.1,但这仍偏低,可以证明当H0成立时,顺序效应的总体方差估计值为(4φ2+2γ)2(1/n1+1/n2)。而处理效应的总体方差估计值则为γ2(1/n1+1/n2)/2,两者至少相差4倍以上[1],而在实际情况中如果假设φ=γ,则两者相差达12倍。如果要取得与交叉设计自身同样大的检验效能,那么α水准应放大3.46倍,即定为0.17,这一问题尚等进一步研究。
5.4 顺序效应存在时,尽管有相应的统计方法来处理,但并不能完全消除其影响。因此若能从方法学上有所突破,则可大大拓宽交叉设计的应用范围。当然,在临床试验,尤其是新药试验中,顺序效应的存在并非只有坏处,有时它的存在反映了两种处理之间可能存在某种相互作用。因此如果效应去除时间充分,但仍存在顺序效应时,往往提示应对这一问题深入研究。
, 百拇医药
参考文献
1 Senn SJ. The AB/BA crossover: past, present and future? Statistical Methods in Medical Research 1994,3:303.
2 倪宗瓒.医学统计学.第二版.北京人民卫生出版社,1998,87.
3 Grizzle JE. The two-period change-over design and its use in clinical trials. Biometrics, 1965,21:467.
4 苏炳华,何清波.交叉试验计量资料分析的SAS程序.中国卫生统计,1991,8(3):21.
5 谢隆化.交叉设计治疗试验的统计分析.中国卫生统计,1991,8(3):21.
, http://www.100md.com
6 Kenward MG, et al. The analysis of binary and categorical data from crossover trials. Stat Methods Med Res 1994 Dec,3(4):325.
7 Grieve AP.Bayesian analyses of two-treatment crossover studies. Stat Methods Med Res 1994 Dec,3(4):407.
8 Lehmacher W.Analysis of the cross-over design in the presence of residual effects. Statistics in Medicine 1991,10:891.
9 Woods JR. The two-period crossover design in medical research. Annals of internal medicine 1989,110:560.
收稿日期:1999-01-29, 百拇医药
单位:华西医科大学卫生统计学教研室 成都610041
关键词:临床试验;交叉设计;顺序效应;遗留效应
数理医药学杂志990408 摘 要 从模型定义出发,阐明常用的交叉设计分析方法及存在的问题,指出了顺序效应的重要性,提出了顺序效应的检验方法以及存在这一效应时的分析方法。
交叉设计是临床试验、尤其是新药试验中常用的一种试验设计方法,它能同时控制时间因素及个体因素对处理方式的影响,但如果在设计时考虑不周,则可能会存在偏倚,这一点往往为应用者所忽视。本文拟以计量资料的交叉试验设计为例,从模型定义出发,阐明现有交叉设计分析方法的缺陷,并就有关问题做进一步探讨。
以平衡的两阶段交叉设计为例,若研究A、B两种药物的疗效是否不同,则设两种顺序,即AB和BA,并将2n名实验对象随机分配到这两种顺序组中,AB组先接受A药,而BA组先接受B药,经过一段“效应去除时间”(washout time)后,AB组病人改用B药,BA组病人改用A药。这样每个病人都均匀的接受了两个阶段、两种药物的处理,在最大限度上平衡了各种非研究因素对结果的影响。显然,这些病人间唯一不同的因素是处理顺序,其中一半病人为AB顺序,而另一半病人为BA顺序,但在整个样本中这一因素是平衡的。
, 百拇医药
1 交叉设计的模型定义及顺序效应的实质
交叉设计的变异有以下几个来源:处理效应、阶段效应、顺序效应和个体差异。其中处理效应是想研究的因素,而顺序效应则在目前常用的统计分析中被忽略。标准的两阶段交叉设计可用如下模型表示[1]:
Yi(j)k=αik+Si(j)+εi(j)k
其中i、j、k分别代表顺序、个体和阶段;Yi(j)k代表测量结果;αik代表在顺序i阶段k时的总效应;Si(j)代表个体j在顺序i中的效应,并设其总体标准差为φ;εi(j)k为随机项,并假设其总体标准差为γ。若设平均效应为μ,阶段效应为ω=ωⅠ-ωⅡ,处理效应为τ=τA-τB,顺序效应为λ=λAB-λBA,则可进一步将αik按不同的周期和阶段分解如下:
, 百拇医药
阶段Ⅰ
阶段Ⅱ
AB顺序(i=1)
μ+τA+ωⅠ
μ+τB+ωⅡ+λAB
BA顺序(i=2)
μ+τB+ωⅠ
μ+τA+ωⅡ+λBA
其中τA和τB代表A、B两种处理的效应;ωⅠ和ωⅡ代表两个阶段的效应;λAB和λBA则代表了两种顺序的效应。顺序效应实质就是通称的遗留效应(carryover effect),即上一阶段的处理由于效应去除时间不足或其它原因干扰了下一阶段的处理效果。如果A、B两种药物均对下一阶段无影响或者影响相同,则AB与BA两种顺序的效应相等或相近,此时该效应混在阶段效应中,即可以忽略它的影响;如果A影响B,而B不影响A,或者A对B的影响不等于B对A的影响,则AB和BA两种顺序的效应不相同,此时就不能忽略其影响,且表现在第二阶段的处理效果中。按照其作用是减小还是增大了两种处理间的差别,可将遗留效应分为正遗留效应和负遗留效应两种,以正遗留效应最为多见。2 常用的分析方法及其问题
, http://www.100md.com
对于交叉设计的计量资料,现在通常采用的分析方法有:交叉设计的方差分析法、差值的方差分析等。
2.1 方差分析法[2] 这是应用最为广泛的一种方法,主要目的是检验处理效应是否存在。相应的H0为:τ=0,并且在分析时将顺序效应忽略不记。因此,两个顺序组可被看为同一个顺序组,其真正的H0假设可进一步变化如下[1]:
YⅠ1+YⅡ2-(YⅠ2+YⅡ1)=0
2μ+2τA+ωⅠ+ωⅡ+λBA-(2μ+2τB+ωⅠ+ωⅡ+λAB)=0
, 百拇医药
2(τA-τB)=λAB-λBA
τ=λ/2
可见,该假设检验只有当λ=0,即顺序效应不存在时才是适宜的。因此应首先进行顺序效应的检验,即Grizzle所提出的两阶段方差分析法[3]。
有的文献给出的方差分析法包括了对顺序效应的分解[4],并同时检验四种变异的来源是否有统计学意义。实际上,当存在顺序效应时,各F值中只有SS顺序/SS个体服从F分布,而SS处理/SS误差、SS阶段/SS误差均不再服从F分布[3];只有顺序效应不存在时,统计量F才均服从F分布,所求出的p值才是无偏的。因此,当顺序效应存在时,现有的方差分析法并不适用。
, 百拇医药
2.2 差数法 差数法是对每位受试者求出两阶段测量结果之差,然后检验两个顺序组的差值有无统计学意义。如果两种处理效果相同,则两顺序组的差值应该无区别。由于受试者间相互独立,并且阶段效应的影响完全相同,因此差值中只包括了顺序和处理两种变异。H0假设可进一步变换如下:
YⅠ1-YⅡ2-(YⅠ2-YⅡ2)=0
τA-τB+ωⅠ+ωⅡ-λAB-(τB-τA+ωⅠ-ωⅡ-λBA)=0
2(τA-τB)=λAB-λBA
, http://www.100md.com
τ=λ/2
可见,差数法的检验实际上与方差分析完全等价。同理,只有当顺序效应不存在时,该检验才能真正反映处理效应是否存在。
3 顺序效应的检验方法
上述分析方法的前提是不存在顺序效应,因此在分析中应首先对顺序效应做检验。常见的方法有3种:
3.1 图示法 即分顺序和阶段计算均值,再分别以阶段和结果变量为x、y轴绘图,在图上将相同药物的两点相连。如果不存在顺序效应,则两条直线应基本平行。此外,还可从图上初步判断哪种药物对下一周期有遗留效应。
3.2 和数法 即将每个受试者的两次测量结果相加,然后检验两顺序组有无统计学差异。由模型易知两顺序组只有顺序效应不同,可推导出其H0假设为λ=0,表明它的确是无偏估计。
, 百拇医药
3.3 方差分析法[4] 在分析时将资料看成类似裂区设计的形式,即顺序组为第一层,其余效应为第二层。这时对顺序效应的检验实际上相当于普通的成组设计,可按前面的方法推导出其H0假设亦为λ=0,实际上,这种方法与和数法完全等价。
4 顺序效应存在时的统计分析方法
由前面的讨论可知,当顺序效应存在时,目前常用的统计分析方法并不适宜。如果是正遗留效应,那么它的存在减少了两种处理间的差异,传统的方法相对较保守,但如果得出拒绝H0的结论,该结论仍是可信的;如果是负遗留效应,则此时必须采用其它分析方法,这正是交叉设计分析方法研究的难点。
4.1 只分析第Ⅰ阶段的数据[5] 从模型可知,顺序效应只存在于第Ⅱ阶段,因此用第Ⅰ阶段数据对处理因素所做的统计推断是无偏的。但这种方法存在检验效能的问题,分析第一阶段的数据只利用了一半的信息量,相当于成组设计,因此检验效能较低。可推导出在H0成立的前提下,处理效应的总体方差估计值γ2(1/n1+1/n2)/2,而只分析第Ⅰ阶段的数据,其总体方差估计值则为(φ2+γ2)(1/n1+1/n2),至少是前者的2倍以上,可见其检验效能下降了许多[1]。
, 百拇医药
4.2 采用其它新方法 近几年来,新的交叉设计分析方法层出不穷,但争议也较大[1,6~8],其中有以下几种方法认识较为一致:分类资料可以采用对数线性模型来分析;计量资料可采用多重分析法、贝叶斯分析法和校正的F检验分析。
5 讨论
5.1 一个理想的交叉设计应当根据药物的半衰期等情况设定相应的效应去除时间,同时还应采用双盲法,并用安慰剂做对照。此时顺序效应的影响很小,一般可采用传统的方差分析等方法来分析。但是在一些临床药物试验中,由于诸多因素使之不能完全采用上述措施,则各种未能完全去除的混杂因素综合表现为顺序效应的影响。在分析时就应首先考虑是否存在顺序效应,并在必要时采用多重分析法等方法来分析。
5.2 顺序效应常常被认为就是指药物残留效应(drug carry-over effect),实际上这只是最常见的一种。除此以外,还有心理效应(psychological carry-over effect)、第Ⅰ阶段用药导致耐药性而产生的撤退效应(withdravwal effect),以及病人身体状况因用药而改变所导致的遗留效应(nonuniform carry-over effect)等等[9]。它们均可通过合理的设计来去除(双盲 法可去除心理效应,适当的效应去除时间可去除大部分其他种类的顺序效应,安慰剂一般不会和有效药物产生相互作用)。
, http://www.100md.com
5.3 值得指出的是,现有的对顺序效应的检验方法并非十分完善,主要是检验效能较低。虽然Grizzle建议将α水准至少定为0.1,但这仍偏低,可以证明当H0成立时,顺序效应的总体方差估计值为(4φ2+2γ)2(1/n1+1/n2)。而处理效应的总体方差估计值则为γ2(1/n1+1/n2)/2,两者至少相差4倍以上[1],而在实际情况中如果假设φ=γ,则两者相差达12倍。如果要取得与交叉设计自身同样大的检验效能,那么α水准应放大3.46倍,即定为0.17,这一问题尚等进一步研究。
5.4 顺序效应存在时,尽管有相应的统计方法来处理,但并不能完全消除其影响。因此若能从方法学上有所突破,则可大大拓宽交叉设计的应用范围。当然,在临床试验,尤其是新药试验中,顺序效应的存在并非只有坏处,有时它的存在反映了两种处理之间可能存在某种相互作用。因此如果效应去除时间充分,但仍存在顺序效应时,往往提示应对这一问题深入研究。
, 百拇医药
参考文献
1 Senn SJ. The AB/BA crossover: past, present and future? Statistical Methods in Medical Research 1994,3:303.
2 倪宗瓒.医学统计学.第二版.北京人民卫生出版社,1998,87.
3 Grizzle JE. The two-period change-over design and its use in clinical trials. Biometrics, 1965,21:467.
4 苏炳华,何清波.交叉试验计量资料分析的SAS程序.中国卫生统计,1991,8(3):21.
5 谢隆化.交叉设计治疗试验的统计分析.中国卫生统计,1991,8(3):21.
, http://www.100md.com
6 Kenward MG, et al. The analysis of binary and categorical data from crossover trials. Stat Methods Med Res 1994 Dec,3(4):325.
7 Grieve AP.Bayesian analyses of two-treatment crossover studies. Stat Methods Med Res 1994 Dec,3(4):407.
8 Lehmacher W.Analysis of the cross-over design in the presence of residual effects. Statistics in Medicine 1991,10:891.
9 Woods JR. The two-period crossover design in medical research. Annals of internal medicine 1989,110:560.
收稿日期:1999-01-29, 百拇医药