临床疗效研究的金方案:随机对照试验
作者:李 强
单位:《实用医学杂志》编辑部 广东省医学情报研究所 广东省广州市 510180
关键词:临床试验;随机对照试验;研究设计
世界华人消化杂志990863 中国图书馆分类号 R_33
Subject headings clinical trials; randomized controlled trial; research design
世界上第一篇应用随机对照设计方案的论文是1948年在British Medical Journal上发表的. 作者是英国著名的生物统计学家Bradford Hill. 这篇论文首次将严密的数理统计理论应用于临床医学的科研设计,并成功地探讨了链霉素对肺结核的疗效. 从这以后,随机对照试验(randomized controlled trial, RCT)开始逐渐被临床医生所接受. 它作为一种评价新疗法的可靠设计方法,在英美等国家被广泛接受和采用,尤其是近十几年来,RCT在筛选、评价临床治疗方法是获得了更为广泛的应用,既有多中心RCT,也有一个研究单位进行的RCT,样本量多达数千、上万,少的则几十人. 研究内容涉及各系统 疾病. 许多利用RCT设计方案完成的论文出现在世界上各学科著名杂志上. 许多RCT结果为临床治疗学提供了有力的证据. 如三苯氧胺对乳腺癌的治疗,链激酶及阿斯匹林对急性心肌梗死的治疗等都是从RCT中获得结论的.
, http://www.100md.com
RCT试验对临床医学的发展具有重要的作用,是医学科研方法学的一项重要进展. RCT试验的结果往往较有说服力. 经过严格的RCT试验有时可以获得一些全新的结论,甚至是一些与以往经验截然相反的结论. 例如,20世纪70年代末期,美国医生通过RCT试验证明,用激光作视网膜弥散疑固术治疗增殖性糖尿病性病变,能有效地降低丧失视力的危险,即破坏一半视网膜能减少失明!这一概念曾使不少眼科医生感到吃惊. 但因这一疗法确实有效,此试验结论可靠,所以,没过几年,这一治疗方法在美国已成为常规疗法.
1 设计方法
按事先规定的诊断标准(或入选标准、排除标准),选择合格的研究对象,将研究对象按照随机化的方法分为试验组(可称干预组)和对照组. 然后,两组分别接受不同的处理措施,在一致的条件和环境里,同步进行观察试验效应,并用客观的标准,对试验结果进行科学的衡量和评价,比较两组疗效的差异.
在具体的实施过程中,研究者根据具体情况可采用完全随机分配的方法,也可将投机倒把相近的受试对象配对可配成区组. 然后,随机分入各组. 有时还可以先按对疾病预后有重要影响的因素(如病型、病情、病程、年龄等),将研究对象进行分层,然后再进行随机分组.
, 百拇医药
研究对象
↓ (入选标准、排除标准)
合格的研究对象
↓ (剔除不愿加入试验者)
自愿加入试验的合格研究对象→分层或配对或配对成区组
随机分组
↓ ↓
试验组 对照组
↓ ↓
接受相应的治疗措施
↓ 一定的观察期
, http://www.100md.com
观察结果
↓
分析结果
RCT设计模式图
2 临床应用
2.1 应用范围 RCT试验在病因学研究有时也会偶尔用到,这在前面有关病因学研究的章节中已经讲过. 应用RCT最多的还是临床疗效研究. 从文献报道来看,RCT用于临床疗效研究时大致有以下两种情况:①用于新疗法与标准疗法的比较. 应用的前提是目前尚不能肯定新疗法疗效比旧疗法好. 列入对照组的患者也受到治疗. 此时,通常要包括较长时间的随访期. ②用于暂且不予治疗不影响愈后的疾病,即治疗与否得失相当的疾病. 这种情况,通常是将研究对象随机分为两组后,对照组暂且不予治疗,即采用空白对照. 对于这类疾病,一定是目前尚未发现或不能肯定存在一种有一定疗效和治疗方法,采用新的疗法患者可能受益,也可能有一定的危险,而不予治疗,自行缓解的可能性很小,多数或早或晚预后不良. 这种情况下,随访期不要太长,一般以不超过1a左右为宜,以便使对照组及早脱离试验. 例如前面提至的激光治疗增殖性眼底病变的糖尿病患者,就属于这种情况.
, 百拇医药
当然,RCT并不适用于所有的临床疗效研究. 例如,创伤性较大的外科手术. 有些疗法虽然未经RCT证实,但长期的临床实践经验已经肯定了其疗效,如阑尾炎、肠套叠的手术治疗,青霉素治疗细菌性肺炎等,此外,某些罕见病的疗效也难用RCT方案. 因为病例来源有限,不能积累足够数量的患者. 某些致死性的急性疾病患者也不宜作RCT试验.
2.2 数据的统计分析 RCT试验的结果变量可分为计数资料、计量资料以及等级资料.
计数资料是指将观察对象按两种属性分类,如生存、死亡、治愈、未治愈,有效、无效等,最后清点的是研究对象的个数,且结局只有两种情况. RCT试验中,有关计数资料的比较分析,通常转化为率. 如果是两组间率的比较,则采用四格表χ2检验或四格表χ2检验的校正公式;如果是多组间率的比较,则要采用行×列表资料χ2检验,但行×列表资料χ2检验只能得出总的结论,如果得出的结论是有差异的,只能说明多个组中至少有两个组彼此之间有差别. 若要进一步分析每组间的差别,还要把行×列表进行分割,使之成为非独立的四格表,再进行两两比较的χ2检验,在RCT试验中,进行多个率的比较时,常不只满足于总体有差异的结论,往往需要知道两两之间到底有无差异.
, http://www.100md.com
计量资料是指对某一个研究对象用定量的方法测定某项指标所得到的资料,一般均有计量单位. RCT试验中,两组间计量资料的比较常用两组间均数比较的t检验;多组间均数比较常用方差分析及q检验. 当然,如果资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法.
等级资料是指研究对象按多种属性(至少三种)分类,彼此之间互斥,如血型(A型、AB型、B型、O型),或彼此间有一定的等级关系,如疗效观察可分为:治愈、显效、好转、无效等,某些临床检验的结果分为-,+,++,+++,++++等,在RCT试验中,等级资料的分析可采用Ridit分析及秩和检验.
如果疗效的发生与某种因素有关,如疗效与药物的剂量、疗效与疗程的长短,疗效与患者年龄的大小等有关,对这情况作分析时,可采用线性相关分析.
如果疗效与多种因素有关,如患者的病情、病程、药物的剂量、疗程、有无合并症等. 可作多因素分析.
, http://www.100md.com
2.3 RCT方案的优点及缺点
2.3.1 RCT方案的优点 ①由于采用了随机分组和同期对照,可以避免与时间变化有关的许多偏倚,可以消除、控制或平衡许多已知或未知的偏倚. 在有一定样本量的基础上,保证了试验组与对照组除了治疗措施不同外,其他非处理因素(即基线情况)有一定的可比性,从而使研究结果有一定的真实性. ②采用盲法,可避免许多观测性偏倚. ③许多统计学的检验假设都是以随机抽样为基础的,所以RCT的试验结果最适合χ2检验、t检验. ④RCT一般均有严格的诊断标准,对研究对象的纳入和排除都有严格的规定.
2.3.2 RCT方案的缺点 ①在时间、人力、财力上花费较大. 大规模的临床RCT所需费用大,耗时长,通常需研究基金的支持. 但目前国内大多数RCT不可能都得到基金的支持,所以开展起来有一定的难度. ②有时选择病例有一定的局限性. ③安慰剂使用不当,会影响患者的治疗. ④随访时间较长时,研究对象有流失,从而影响结果的真实性. ⑤正是由于研究对象是经过严格筛选的,所以代表性相对较差,不能代表疾病的全貌,不能揭示疾病的总体规律.
, 百拇医药
但总的来说,RCT的优点是主要的,是显而易见的,也正是如此,才被誉称为临床试验的标准金方案. 目前,任何一种新药在大规模用于临床之前,一定要经过多中心RCT的验证. 国外评价临床疗效的论文绝大多数均采用RCT方案,国内有关RCT的报道也正日益增多,并越来越引起更多学者的重视.
3 RCT试验的一些特殊模式
严格的RCT设计在具体的实施过程中,因医疗单位和研究题目的具体情况不同,可能会有不同的困难. 临床科研工作者在长期的临床科研实践中积累了宝贵的经验,对经典的RCT设计有些变通和改变,从而诞生了一些RCT的特殊设计模式.
3.1 半随机对照试验(quasi-randomized control trial) 随机化分组要依赖数字表,具体执行起来,有时较为麻烦. 所以,有的医生便采取了一些简单的半随机方法对患者进行分组,如按患者身份证号码的尾数,或就诊日期,或病历顺号尾数的奇偶数来分组. 这种半随机对照试验同样有严格的入选标准、排除标准、标准化的干预措施、明确的疗效评定标准,结果可信度较好. 两组间非处理因素可保持基本一致,组间可比性较好. 这种设计方法有同期对照,结果较有说服力. 如各组间样本量相等,更便于统计分析数据,检验效率高.
, 百拇医药
此种设计方案的分组方法受人为的选择偏倚的机会较大,研究者可能会有意识地将部分受试对象分入某组,导致结果不完全可信. 半随机对照试验所花费的时间精力不亚于RCT,所以,与其作半随机对照试验,不如认真严谨一点,作完全的RCT.
3.2 非等量的RCT RCT设计方案的两组间样本量应相同,但在实际研究中,有时为比较一种新疗法与标准疗法的疗效,病例来源有限,而标准疗法的疗效又为人们所熟知,这时,就可以采用非等量的RCT设计方法. 非等量RCT通常采用试验组与试验组样本量为2∶1或3∶2的比例来随机分组. 但这里需要注意,采用非等量RCT设计方案时,两组相差比例不宜太大. 否则,会影响检验效能power值的大小. 一般地,如果α=0.05,当试验组患者数占总人数(即试验组与对照组人数之和)的一半时,power值为0.95,当试验组患者数占总人数的70%时,power值约为0.934,当试验组患者数占总人数的80%时,power值约为0.8,当试验组患者数占总人数的90%时,power值只有0.57.
, 百拇医药
3.3 组群随机对照试验(claster randomized control trial) 组群随机对照试验是指以一个家庭、一个车间、一个医院、一对夫妇作为随机试验的一个观察单位,进行随机对照试验. 每个单独的观察单位也是随机地被分配到试验组和对照组,分别接受不同的治疗措施. 如比较低钠饮食对高血压的一级预防作用,并与普通饮食比较,随访若干年,观察两组高血压的发生情况. 这时,以一个家庭为观察单位,选择群组随机对照试验就比较合适. 如果不采取组群随机的方法,而是采取普通RCT设计方案,则会出现一个家庭成员中部分被分为低钠饮食组,部分被分为普通饮食组,不但具体实施时可行性差,而且沾染和干扰也是不可避免的,从而影响研究结果的可靠性.
通讯作者 李强
4 参考文献
1 Sackett DL, Rosenberg WMC, Gray JA. Evidence based medicine: what it is and what it isn't. Bri Med J, 1996;312:71
, 百拇医药
2 Feinstein AR, Horwitz R. Problems in the “Evidence”of “Evidence-based medicine”. Am J Med, 1997;103:529
3 Rsenberg W, Donnald A. Evidence based medicine: an approach to clinical problem-solving. Br Med J, 1995;310:1122
4 Sackett DL, Rosenberg WMC, Gray JA. Evidence-based medicine: author's reply. Br Med J, 1996;313:170
5 Sackett DL. Evidence-based medicine. Spine, 1998;10:1085
6 王家良主编. 临床流行病学. 上海:上海科学技术出版社,1984:24
7 毛宗福. 临床诊断试验中的缺陷实例分析. 湖南医学,1998;5:302
收稿日期 1999-07-01, 百拇医药
单位:《实用医学杂志》编辑部 广东省医学情报研究所 广东省广州市 510180
关键词:临床试验;随机对照试验;研究设计
世界华人消化杂志990863 中国图书馆分类号 R_33
Subject headings clinical trials; randomized controlled trial; research design
世界上第一篇应用随机对照设计方案的论文是1948年在British Medical Journal上发表的. 作者是英国著名的生物统计学家Bradford Hill. 这篇论文首次将严密的数理统计理论应用于临床医学的科研设计,并成功地探讨了链霉素对肺结核的疗效. 从这以后,随机对照试验(randomized controlled trial, RCT)开始逐渐被临床医生所接受. 它作为一种评价新疗法的可靠设计方法,在英美等国家被广泛接受和采用,尤其是近十几年来,RCT在筛选、评价临床治疗方法是获得了更为广泛的应用,既有多中心RCT,也有一个研究单位进行的RCT,样本量多达数千、上万,少的则几十人. 研究内容涉及各系统 疾病. 许多利用RCT设计方案完成的论文出现在世界上各学科著名杂志上. 许多RCT结果为临床治疗学提供了有力的证据. 如三苯氧胺对乳腺癌的治疗,链激酶及阿斯匹林对急性心肌梗死的治疗等都是从RCT中获得结论的.
, http://www.100md.com
RCT试验对临床医学的发展具有重要的作用,是医学科研方法学的一项重要进展. RCT试验的结果往往较有说服力. 经过严格的RCT试验有时可以获得一些全新的结论,甚至是一些与以往经验截然相反的结论. 例如,20世纪70年代末期,美国医生通过RCT试验证明,用激光作视网膜弥散疑固术治疗增殖性糖尿病性病变,能有效地降低丧失视力的危险,即破坏一半视网膜能减少失明!这一概念曾使不少眼科医生感到吃惊. 但因这一疗法确实有效,此试验结论可靠,所以,没过几年,这一治疗方法在美国已成为常规疗法.
1 设计方法
按事先规定的诊断标准(或入选标准、排除标准),选择合格的研究对象,将研究对象按照随机化的方法分为试验组(可称干预组)和对照组. 然后,两组分别接受不同的处理措施,在一致的条件和环境里,同步进行观察试验效应,并用客观的标准,对试验结果进行科学的衡量和评价,比较两组疗效的差异.
在具体的实施过程中,研究者根据具体情况可采用完全随机分配的方法,也可将投机倒把相近的受试对象配对可配成区组. 然后,随机分入各组. 有时还可以先按对疾病预后有重要影响的因素(如病型、病情、病程、年龄等),将研究对象进行分层,然后再进行随机分组.
, 百拇医药
研究对象
↓ (入选标准、排除标准)
合格的研究对象
↓ (剔除不愿加入试验者)
自愿加入试验的合格研究对象→分层或配对或配对成区组
随机分组
↓ ↓
试验组 对照组
↓ ↓
接受相应的治疗措施
↓ 一定的观察期
, http://www.100md.com
观察结果
↓
分析结果
RCT设计模式图
2 临床应用
2.1 应用范围 RCT试验在病因学研究有时也会偶尔用到,这在前面有关病因学研究的章节中已经讲过. 应用RCT最多的还是临床疗效研究. 从文献报道来看,RCT用于临床疗效研究时大致有以下两种情况:①用于新疗法与标准疗法的比较. 应用的前提是目前尚不能肯定新疗法疗效比旧疗法好. 列入对照组的患者也受到治疗. 此时,通常要包括较长时间的随访期. ②用于暂且不予治疗不影响愈后的疾病,即治疗与否得失相当的疾病. 这种情况,通常是将研究对象随机分为两组后,对照组暂且不予治疗,即采用空白对照. 对于这类疾病,一定是目前尚未发现或不能肯定存在一种有一定疗效和治疗方法,采用新的疗法患者可能受益,也可能有一定的危险,而不予治疗,自行缓解的可能性很小,多数或早或晚预后不良. 这种情况下,随访期不要太长,一般以不超过1a左右为宜,以便使对照组及早脱离试验. 例如前面提至的激光治疗增殖性眼底病变的糖尿病患者,就属于这种情况.
, 百拇医药
当然,RCT并不适用于所有的临床疗效研究. 例如,创伤性较大的外科手术. 有些疗法虽然未经RCT证实,但长期的临床实践经验已经肯定了其疗效,如阑尾炎、肠套叠的手术治疗,青霉素治疗细菌性肺炎等,此外,某些罕见病的疗效也难用RCT方案. 因为病例来源有限,不能积累足够数量的患者. 某些致死性的急性疾病患者也不宜作RCT试验.
2.2 数据的统计分析 RCT试验的结果变量可分为计数资料、计量资料以及等级资料.
计数资料是指将观察对象按两种属性分类,如生存、死亡、治愈、未治愈,有效、无效等,最后清点的是研究对象的个数,且结局只有两种情况. RCT试验中,有关计数资料的比较分析,通常转化为率. 如果是两组间率的比较,则采用四格表χ2检验或四格表χ2检验的校正公式;如果是多组间率的比较,则要采用行×列表资料χ2检验,但行×列表资料χ2检验只能得出总的结论,如果得出的结论是有差异的,只能说明多个组中至少有两个组彼此之间有差别. 若要进一步分析每组间的差别,还要把行×列表进行分割,使之成为非独立的四格表,再进行两两比较的χ2检验,在RCT试验中,进行多个率的比较时,常不只满足于总体有差异的结论,往往需要知道两两之间到底有无差异.
, http://www.100md.com
计量资料是指对某一个研究对象用定量的方法测定某项指标所得到的资料,一般均有计量单位. RCT试验中,两组间计量资料的比较常用两组间均数比较的t检验;多组间均数比较常用方差分析及q检验. 当然,如果资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法.
等级资料是指研究对象按多种属性(至少三种)分类,彼此之间互斥,如血型(A型、AB型、B型、O型),或彼此间有一定的等级关系,如疗效观察可分为:治愈、显效、好转、无效等,某些临床检验的结果分为-,+,++,+++,++++等,在RCT试验中,等级资料的分析可采用Ridit分析及秩和检验.
如果疗效的发生与某种因素有关,如疗效与药物的剂量、疗效与疗程的长短,疗效与患者年龄的大小等有关,对这情况作分析时,可采用线性相关分析.
如果疗效与多种因素有关,如患者的病情、病程、药物的剂量、疗程、有无合并症等. 可作多因素分析.
, http://www.100md.com
2.3 RCT方案的优点及缺点
2.3.1 RCT方案的优点 ①由于采用了随机分组和同期对照,可以避免与时间变化有关的许多偏倚,可以消除、控制或平衡许多已知或未知的偏倚. 在有一定样本量的基础上,保证了试验组与对照组除了治疗措施不同外,其他非处理因素(即基线情况)有一定的可比性,从而使研究结果有一定的真实性. ②采用盲法,可避免许多观测性偏倚. ③许多统计学的检验假设都是以随机抽样为基础的,所以RCT的试验结果最适合χ2检验、t检验. ④RCT一般均有严格的诊断标准,对研究对象的纳入和排除都有严格的规定.
2.3.2 RCT方案的缺点 ①在时间、人力、财力上花费较大. 大规模的临床RCT所需费用大,耗时长,通常需研究基金的支持. 但目前国内大多数RCT不可能都得到基金的支持,所以开展起来有一定的难度. ②有时选择病例有一定的局限性. ③安慰剂使用不当,会影响患者的治疗. ④随访时间较长时,研究对象有流失,从而影响结果的真实性. ⑤正是由于研究对象是经过严格筛选的,所以代表性相对较差,不能代表疾病的全貌,不能揭示疾病的总体规律.
, 百拇医药
但总的来说,RCT的优点是主要的,是显而易见的,也正是如此,才被誉称为临床试验的标准金方案. 目前,任何一种新药在大规模用于临床之前,一定要经过多中心RCT的验证. 国外评价临床疗效的论文绝大多数均采用RCT方案,国内有关RCT的报道也正日益增多,并越来越引起更多学者的重视.
3 RCT试验的一些特殊模式
严格的RCT设计在具体的实施过程中,因医疗单位和研究题目的具体情况不同,可能会有不同的困难. 临床科研工作者在长期的临床科研实践中积累了宝贵的经验,对经典的RCT设计有些变通和改变,从而诞生了一些RCT的特殊设计模式.
3.1 半随机对照试验(quasi-randomized control trial) 随机化分组要依赖数字表,具体执行起来,有时较为麻烦. 所以,有的医生便采取了一些简单的半随机方法对患者进行分组,如按患者身份证号码的尾数,或就诊日期,或病历顺号尾数的奇偶数来分组. 这种半随机对照试验同样有严格的入选标准、排除标准、标准化的干预措施、明确的疗效评定标准,结果可信度较好. 两组间非处理因素可保持基本一致,组间可比性较好. 这种设计方法有同期对照,结果较有说服力. 如各组间样本量相等,更便于统计分析数据,检验效率高.
, 百拇医药
此种设计方案的分组方法受人为的选择偏倚的机会较大,研究者可能会有意识地将部分受试对象分入某组,导致结果不完全可信. 半随机对照试验所花费的时间精力不亚于RCT,所以,与其作半随机对照试验,不如认真严谨一点,作完全的RCT.
3.2 非等量的RCT RCT设计方案的两组间样本量应相同,但在实际研究中,有时为比较一种新疗法与标准疗法的疗效,病例来源有限,而标准疗法的疗效又为人们所熟知,这时,就可以采用非等量的RCT设计方法. 非等量RCT通常采用试验组与试验组样本量为2∶1或3∶2的比例来随机分组. 但这里需要注意,采用非等量RCT设计方案时,两组相差比例不宜太大. 否则,会影响检验效能power值的大小. 一般地,如果α=0.05,当试验组患者数占总人数(即试验组与对照组人数之和)的一半时,power值为0.95,当试验组患者数占总人数的70%时,power值约为0.934,当试验组患者数占总人数的80%时,power值约为0.8,当试验组患者数占总人数的90%时,power值只有0.57.
, 百拇医药
3.3 组群随机对照试验(claster randomized control trial) 组群随机对照试验是指以一个家庭、一个车间、一个医院、一对夫妇作为随机试验的一个观察单位,进行随机对照试验. 每个单独的观察单位也是随机地被分配到试验组和对照组,分别接受不同的治疗措施. 如比较低钠饮食对高血压的一级预防作用,并与普通饮食比较,随访若干年,观察两组高血压的发生情况. 这时,以一个家庭为观察单位,选择群组随机对照试验就比较合适. 如果不采取组群随机的方法,而是采取普通RCT设计方案,则会出现一个家庭成员中部分被分为低钠饮食组,部分被分为普通饮食组,不但具体实施时可行性差,而且沾染和干扰也是不可避免的,从而影响研究结果的可靠性.
通讯作者 李强
4 参考文献
1 Sackett DL, Rosenberg WMC, Gray JA. Evidence based medicine: what it is and what it isn't. Bri Med J, 1996;312:71
, 百拇医药
2 Feinstein AR, Horwitz R. Problems in the “Evidence”of “Evidence-based medicine”. Am J Med, 1997;103:529
3 Rsenberg W, Donnald A. Evidence based medicine: an approach to clinical problem-solving. Br Med J, 1995;310:1122
4 Sackett DL, Rosenberg WMC, Gray JA. Evidence-based medicine: author's reply. Br Med J, 1996;313:170
5 Sackett DL. Evidence-based medicine. Spine, 1998;10:1085
6 王家良主编. 临床流行病学. 上海:上海科学技术出版社,1984:24
7 毛宗福. 临床诊断试验中的缺陷实例分析. 湖南医学,1998;5:302
收稿日期 1999-07-01, 百拇医药