如何开展临床疗效研究
广东省医学情报研究所《实用医学杂志》编辑部广东省广州市 510180
项目负责人 李强
收稿日期 2000-01-05 接收日期 2000-03-05
Subject headings clinical trial; treatment outcome; clinical protocols; research; therapeutic equivalency
主题词 临床试验;治疗结果;临床方案;研究;治疗等效
李强. 如何开展临床疗效研究. 世界华人消化杂志,2000;8(7):806-807
, 百拇医药
摘 要临床疗效研究是临床研究最常见的类型,本文重点从临床科研方法学角度介绍临床疗 效研究的正确设计方法、估计样本量的经验性公式及影响临床疗效的几个重要因素. 临床医师对患者所患疾病作出正确诊断之后,下一步就是如何对患者进行治疗了. 临床医师在对患者选择、确定治疗方案时,一定要选择那些经过科学的验证,证明确实有效的治疗措施,而不是临床医师个人认为有效但实际上疗效不佳,甚至是无效的治疗措施. 临床医师在阅读医学文献时,也会经常遇到有关疗效评价的医学论文. 此外,临床医学本身的发展,也要求临床医师不断研究和发展新的、安全有效的防治措施,能更卓有成效地防治疾病,这是临床研究领域里十分活跃的研究课题. 所以,临床医师掌握如何提高医疗、科研水平,培养阅读、评价医学文献都是十分重要的. 对于医学期刊的编审人员同样也有助于提高编审业务水平. 然而,目前国内许多关于临床疗效的研究成果,缺乏真实性和 可靠性,其试验结果不能被有效地重复. 有些药物被宣传成百病皆治的良药,有些医学杂志甚至还保留过去设置的“专家经验”、“经验总结”等栏目,对临床疗效的研究还停留在经验医学的阶段.近年来,国外学者已越来越重视用科学的设计方法来研究临床疗效,并取得了重大的进展, 具体表现为:①经验医学逐步走向循证医学(evidence based medicine, EBM);②临床医学 家通过大量的正反两方面的经验和教训,一致认识到用科学的方法进行临床疗效研究的重要 性;③临床医师、生物统计学家、临床流行病学家密切合作,发展了一系列科学性较强的临 床疗效研究方法[1,2].
, 百拇医药
1 临床疗效研究的设计要点临床疗效研究是以患者群为研究对象,比较干预与对照所显示的效果. 这种干预措施可以是 药物、外科手术方法、康复措施、治疗方案(如肿瘤化疗),也可以是一种特定形式的治疗单元的评价,如CCU(冠心病监护病房)的作用. 临床疗效研究的研究对象是人,而且是患有疾 病的活着的人. 人除了有生物属性以外,还有社会属性及复杂的心理活动,这就决定了临床 疗效研究不可能象基础实验研究那样容易使样本标准化、规范化. 临床疗效的影响通常是多 因素的. 在临床疗效研究过程中,能否去伪存真,从千变万化的临床现象中总结出科学的 结论来,在很大程度上取决于研究设计的严谨性和科学性. 在临床疗效研究的设计中,应严 格贯彻随机、对照、盲法的原则. 临床疗效研究的设计要点主要包括以下几个方面:
1.1 明确研究对象 确保研究对象对其总体的代表性. 研究对象一定符合诊断标准,患者的诊断应准确无误,同时,还要有一定的排除标准. 选择研究对象时,必须严格按着诊断标准来选择,如果诊断标 准不可靠,则入选对象不能代表研究的目标人群.
, 百拇医药
1.2 在均衡和齐同的条件下设立对照 正确设立对照是临床疗效研究的一个核心问题. 对照是疗效比较的参照物,设立对照的意义 在于说明临床试验中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响 . 试验组与对照组必须具有可比性,也就是说试验组和对照组除了干预处理措施不同以外, 其他各个方面两组应是相同或相似的,即达到齐同均衡. 只有达到了齐同均衡的情况下,两 组观察结果的差异才能归因于干预措施的效应. 为了达到齐同均衡的要求,有必要对观察组 和试验组在正式试验开始前进行基线测量,通过询问、检查和测量,取得与试验有关的各项 基础参数,如性别、年龄、病情实验室检查等,以了解两组是否具有可比性.
1.3 选择合适的研究设计方案 依据临床疗效的具体情况,可选择不同形式的设计方案,如随机对照试验、非随机对照试验 、历史对照研究、配对设计、交叉设计等. 在临床疗效研究中,较常使用的设计方法是随机 对照试验和配对设计研究,特别是执行盲法的随机对照试验结论最为可靠.
, 百拇医药
1.4 估算样本量 随机抽样和随机分组是保证两组间具有可比性的一个重要措施. 但仅有随机化是不够的,还应有一定的样本量. 如果样本量过小,尽管采用随机化的方法,也保证不了两组间的基线情 况具有可比性. 一般来说,为了节省费用和尽早取得研究成果,研究者总是希望所取的样本 量越小越好. 从伦理学的角度考虑,如果在研究中证实一种疗法好,那么对照组也不需长期 接受另一种较差的疗法. 另一方面,如果患者数太少,以致不能得出明确的结论,那也是一 种浪费时间与精力的行为. 样本量的大小取决于三个因素:本研究所期望达到的精确度、敏 感度及Ⅱ类统计错误(β)的概率. 试验的精确度决定试验的患者数. 所要求的结果愈精确, 所需的样本量就愈大. Ⅱ类统计错误同样决定样本量的大小,要求的Ⅱ类统计错误的概率 愈小,所需的样本量愈大. Ⅰ类错误(α)可以定义为试验证实两种疗法有差别,但实际上无 差别的概率;Ⅱ类统计错误是指两种疗法确实存在差别,但试验本身未能证明有差别. 在临 床疗效研究中,Ⅰ类错误的最大允许概率控制在非常小的范围内,一般取α=0.05,所以一 个临床试验具有α=0.05的“显著性水平”,就意味着对于Ⅰ类错误的最大允许概率为5%, 对于Ⅱ类统计错误的控制,通常用把握度来表示,Power=1-β,Power值反映的是如果事实 上确实存在治疗上的差别,本试验发现此差别的能力. 一般Power值最好大于80%.以下有Kastenbaum和Cochran的两组经验性资料,可供研究者在确定样本量时参考(表1,表2 ). 当然,针对不同的设计方案,统计学上也有不同的样本量计算公式.
, 百拇医药
表1 两组呈现差别的均数差/标准差与受试例数的关系 (α=0.05,Power=95%)
, http://www.100md.com
如某一种系的小鼠,平均寿命为125wk±20wk,现在研究X线照射是否会缩短小鼠的寿命. 如果研究人员以平均缩短5wk为目标,那么均数差/标准差=5/20=0.25,参照表1,则每组样本量在500以上.
表2 两组百分率呈现差别的每组受试者样本量 (例)
, 百拇医药
如现有疗法治愈率为75%,如要求新疗法能将治愈率提高15%,则每组要有160人,两组共320人.
1.5 疗效考核指标的确定临床疗效研究的中心内容 是比较试验组和对照组在接受不同的处理因素后的不同效应,而这 种效应的差别是通过观察或测量一定效应指标而获得的. 所以,疗效考核指标的选择,也是 一项关键的措施. 根据不同的治疗目的,实验室检查结果、症状、复发部位都可以作为临床 疗效的考核指标. 按反应的性质,疗效考核指标可分定性的计数指标,如阳性、阴性、痊愈 、好转、无效、恶化、复发等;此外,还有计量指标. 实验室检查则多属于计量指标. 计量指标易于标准化,有良好的质量控制. 在选择计量指标时,应注意所选择指标要能真正反映研究对象的疗效,也就是说,所选择的指标薪虾玫奶匾煨 例如,痰癌细胞检出对肺癌的诊断是特异的. 在确定疗效考核指标时,还应注意选择客观的指标,便于测定和计算,易于被受试者接受,便于操作者执行. 此外,疗效考核指标要有一定的灵敏性和稳定性,能被不同的操作者在不同时间、地点重复证实,误差应在允许范围内.
, 百拇医药
1.6 防止沾染与干扰 沾染是指对照组意外地接受试验组的干预措施. 例如,本应是试验组采用的防治措施,而误 用到对照组身上,或对照组自己私下用了试验组所用的防治措施,这样都会使两组间应有 的疗效差异减少或者显示不出,从而影响研究结果. 干扰是指试验组患者额外地接受了其他 的治疗措施而对照组则没有,因而出现较强的效应,造成假阳性,同样影响研究结 论的真实性. 沾染和干扰都是在研究观察过程中产生的问题,所以,应在研究过程中认真注 意管理,并防止其发生.
2 影响临床疗效的因素 在临床疗效研究中,患者在接受干预措施后所表现出的疗效并不一定单单是干预措施的特异 作用结果,而是受许多因素的综合影响. 早期的临床疗效研究多是病例分析性质的临床经验 总结,不设对照组,也不管疾病是否有自愈倾向,笼统地根据治疗后病情的变化用治愈率表 示疗效,这种研究方法是非常不严谨的,没有考虑到影响疗效的复杂因素. 影响疗效的因素 有许多,主要包括以下几方面.
, http://www.100md.com
2.1 干预措施 干预措施所引起的病情改善是临床疗效研究所要考核的核心内容. 研究者要确定干预措施本身对疾病的治疗作用,必须要了解干预措施本身所引起的效应到底有多大.
2.2 疾病的自行缓解 临床医师要评价干预措施的治疗效果,往往是根据疾病的自然病程或患者的预后来评价的. 然而目前许多疾病的自然病程还不能完全预料. 不同的疾病有不同的病理发生期、临床分期 特征及临床结局,既使同一种疾病在不同的患者中表现的类型、病程、严重程度、试验前的 治疗、并发症和预后也不一样. 例如,许多急性自限性疾病,如上呼吸道感染、急性胃肠炎、急性脑血管病,患者常症状明显时前来就诊,接受干预措施后病情的改善,很可能就是病 情自行缓解的结果,而不是干预措施的效应. 还有一些慢性迁延性疾病病程较长,病情常有 起伏,可自行缓解和活动,如果给予干预措施之后,恰好赶上疾病病情的缓解期,那么所表 现出来的病情好转也同样.
, 百拇医药
2.3 霍桑效应 霍桑效应(Hawthorne effect)是指某些患者因喜欢、迷信、讨好或厌恶某医师或医院而产生 正负两方面的影响. 如在观察比较某种新药的疗效时,如果不采用盲法,患者知道自己用 的是新药,从而对新药能治好他的病产生极大的期望,医师平时给予他的关照可能也较多, 医师在询问患者病情改善情况时,患者可能会因此而向医师报告好的结果,而实际上药物本 身的疗效并没有那么好.
2.4 安慰剂效应 安慰剂是指与所考核药物在外形、颜色和气味方面相同但不含己知有效成分的制剂,常用的 有淀粉及生理盐水注射液. 研究表明,在患者信任的情况下给予安慰剂,可以使30%的患者 的一些严重不适的症状得到减轻.
2.5 其他 包括研究对象的选择,观察测量的指标和方法,以及受试者的失访率等.由上述可见,在研究终点时所统计出来的疗效,往往是多种因素综合作用的结果. 成功的临 床疗效研究应能将以上不同的效应分开,充分显露干预措施的特异效应,消除和减少研究的 误差.
3 参考文献1 孙中行主编. 临床流行病学. 沈阳:辽宁省科学技术出版社,1996:175-179
2 洪明晃主编. 医学科学研究设计测量评价. 广州:中山大学出版社,1995:128-132, http://www.100md.com(李 强)
项目负责人 李强
收稿日期 2000-01-05 接收日期 2000-03-05
Subject headings clinical trial; treatment outcome; clinical protocols; research; therapeutic equivalency
主题词 临床试验;治疗结果;临床方案;研究;治疗等效
李强. 如何开展临床疗效研究. 世界华人消化杂志,2000;8(7):806-807
, 百拇医药
摘 要临床疗效研究是临床研究最常见的类型,本文重点从临床科研方法学角度介绍临床疗 效研究的正确设计方法、估计样本量的经验性公式及影响临床疗效的几个重要因素. 临床医师对患者所患疾病作出正确诊断之后,下一步就是如何对患者进行治疗了. 临床医师在对患者选择、确定治疗方案时,一定要选择那些经过科学的验证,证明确实有效的治疗措施,而不是临床医师个人认为有效但实际上疗效不佳,甚至是无效的治疗措施. 临床医师在阅读医学文献时,也会经常遇到有关疗效评价的医学论文. 此外,临床医学本身的发展,也要求临床医师不断研究和发展新的、安全有效的防治措施,能更卓有成效地防治疾病,这是临床研究领域里十分活跃的研究课题. 所以,临床医师掌握如何提高医疗、科研水平,培养阅读、评价医学文献都是十分重要的. 对于医学期刊的编审人员同样也有助于提高编审业务水平. 然而,目前国内许多关于临床疗效的研究成果,缺乏真实性和 可靠性,其试验结果不能被有效地重复. 有些药物被宣传成百病皆治的良药,有些医学杂志甚至还保留过去设置的“专家经验”、“经验总结”等栏目,对临床疗效的研究还停留在经验医学的阶段.近年来,国外学者已越来越重视用科学的设计方法来研究临床疗效,并取得了重大的进展, 具体表现为:①经验医学逐步走向循证医学(evidence based medicine, EBM);②临床医学 家通过大量的正反两方面的经验和教训,一致认识到用科学的方法进行临床疗效研究的重要 性;③临床医师、生物统计学家、临床流行病学家密切合作,发展了一系列科学性较强的临 床疗效研究方法[1,2].
, 百拇医药
1 临床疗效研究的设计要点临床疗效研究是以患者群为研究对象,比较干预与对照所显示的效果. 这种干预措施可以是 药物、外科手术方法、康复措施、治疗方案(如肿瘤化疗),也可以是一种特定形式的治疗单元的评价,如CCU(冠心病监护病房)的作用. 临床疗效研究的研究对象是人,而且是患有疾 病的活着的人. 人除了有生物属性以外,还有社会属性及复杂的心理活动,这就决定了临床 疗效研究不可能象基础实验研究那样容易使样本标准化、规范化. 临床疗效的影响通常是多 因素的. 在临床疗效研究过程中,能否去伪存真,从千变万化的临床现象中总结出科学的 结论来,在很大程度上取决于研究设计的严谨性和科学性. 在临床疗效研究的设计中,应严 格贯彻随机、对照、盲法的原则. 临床疗效研究的设计要点主要包括以下几个方面:
1.1 明确研究对象 确保研究对象对其总体的代表性. 研究对象一定符合诊断标准,患者的诊断应准确无误,同时,还要有一定的排除标准. 选择研究对象时,必须严格按着诊断标准来选择,如果诊断标 准不可靠,则入选对象不能代表研究的目标人群.
, 百拇医药
1.2 在均衡和齐同的条件下设立对照 正确设立对照是临床疗效研究的一个核心问题. 对照是疗效比较的参照物,设立对照的意义 在于说明临床试验中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响 . 试验组与对照组必须具有可比性,也就是说试验组和对照组除了干预处理措施不同以外, 其他各个方面两组应是相同或相似的,即达到齐同均衡. 只有达到了齐同均衡的情况下,两 组观察结果的差异才能归因于干预措施的效应. 为了达到齐同均衡的要求,有必要对观察组 和试验组在正式试验开始前进行基线测量,通过询问、检查和测量,取得与试验有关的各项 基础参数,如性别、年龄、病情实验室检查等,以了解两组是否具有可比性.
1.3 选择合适的研究设计方案 依据临床疗效的具体情况,可选择不同形式的设计方案,如随机对照试验、非随机对照试验 、历史对照研究、配对设计、交叉设计等. 在临床疗效研究中,较常使用的设计方法是随机 对照试验和配对设计研究,特别是执行盲法的随机对照试验结论最为可靠.
, 百拇医药
1.4 估算样本量 随机抽样和随机分组是保证两组间具有可比性的一个重要措施. 但仅有随机化是不够的,还应有一定的样本量. 如果样本量过小,尽管采用随机化的方法,也保证不了两组间的基线情 况具有可比性. 一般来说,为了节省费用和尽早取得研究成果,研究者总是希望所取的样本 量越小越好. 从伦理学的角度考虑,如果在研究中证实一种疗法好,那么对照组也不需长期 接受另一种较差的疗法. 另一方面,如果患者数太少,以致不能得出明确的结论,那也是一 种浪费时间与精力的行为. 样本量的大小取决于三个因素:本研究所期望达到的精确度、敏 感度及Ⅱ类统计错误(β)的概率. 试验的精确度决定试验的患者数. 所要求的结果愈精确, 所需的样本量就愈大. Ⅱ类统计错误同样决定样本量的大小,要求的Ⅱ类统计错误的概率 愈小,所需的样本量愈大. Ⅰ类错误(α)可以定义为试验证实两种疗法有差别,但实际上无 差别的概率;Ⅱ类统计错误是指两种疗法确实存在差别,但试验本身未能证明有差别. 在临 床疗效研究中,Ⅰ类错误的最大允许概率控制在非常小的范围内,一般取α=0.05,所以一 个临床试验具有α=0.05的“显著性水平”,就意味着对于Ⅰ类错误的最大允许概率为5%, 对于Ⅱ类统计错误的控制,通常用把握度来表示,Power=1-β,Power值反映的是如果事实 上确实存在治疗上的差别,本试验发现此差别的能力. 一般Power值最好大于80%.以下有Kastenbaum和Cochran的两组经验性资料,可供研究者在确定样本量时参考(表1,表2 ). 当然,针对不同的设计方案,统计学上也有不同的样本量计算公式.
, 百拇医药
表1 两组呈现差别的均数差/标准差与受试例数的关系 (α=0.05,Power=95%)
| 均数差/标准差 | 每组例数 |
| 0.16 | 1000 |
| 0.23 | 500 |
| 0.36 | 200 |
| 0.52 | 100 |
| 0.66 | 60 |
| 0.82 | 40 |
| 0.95 | 30 |
| 1.02 | 26 |
| 1.11 | 22 |
| 1.32 | 16 |
| 1.71 | 10 |
, http://www.100md.com
如某一种系的小鼠,平均寿命为125wk±20wk,现在研究X线照射是否会缩短小鼠的寿命. 如果研究人员以平均缩短5wk为目标,那么均数差/标准差=5/20=0.25,参照表1,则每组样本量在500以上.
表2 两组百分率呈现差别的每组受试者样本量 (例)
| 原法有效率 | 新法提高的改善率 | ||||
| 5% | 10% | 15% | 25% | 50% | |
| 5% | 701 | 220 | 115 | 52 | 19 |
| 10% | 1128 | 324 | 160 | 67 | 21 |
| 25% | 2075 | 542 | 251 | 95 | 24 |
| 50% | 2589 | 641 | 280 | 98 | |
| 75% | 1086 | 410 | 160 | ||
| 90% | 701 |
, 百拇医药
如现有疗法治愈率为75%,如要求新疗法能将治愈率提高15%,则每组要有160人,两组共320人.
1.5 疗效考核指标的确定临床疗效研究的中心内容 是比较试验组和对照组在接受不同的处理因素后的不同效应,而这 种效应的差别是通过观察或测量一定效应指标而获得的. 所以,疗效考核指标的选择,也是 一项关键的措施. 根据不同的治疗目的,实验室检查结果、症状、复发部位都可以作为临床 疗效的考核指标. 按反应的性质,疗效考核指标可分定性的计数指标,如阳性、阴性、痊愈 、好转、无效、恶化、复发等;此外,还有计量指标. 实验室检查则多属于计量指标. 计量指标易于标准化,有良好的质量控制. 在选择计量指标时,应注意所选择指标要能真正反映研究对象的疗效,也就是说,所选择的指标薪虾玫奶匾煨 例如,痰癌细胞检出对肺癌的诊断是特异的. 在确定疗效考核指标时,还应注意选择客观的指标,便于测定和计算,易于被受试者接受,便于操作者执行. 此外,疗效考核指标要有一定的灵敏性和稳定性,能被不同的操作者在不同时间、地点重复证实,误差应在允许范围内.
, 百拇医药
1.6 防止沾染与干扰 沾染是指对照组意外地接受试验组的干预措施. 例如,本应是试验组采用的防治措施,而误 用到对照组身上,或对照组自己私下用了试验组所用的防治措施,这样都会使两组间应有 的疗效差异减少或者显示不出,从而影响研究结果. 干扰是指试验组患者额外地接受了其他 的治疗措施而对照组则没有,因而出现较强的效应,造成假阳性,同样影响研究结 论的真实性. 沾染和干扰都是在研究观察过程中产生的问题,所以,应在研究过程中认真注 意管理,并防止其发生.
2 影响临床疗效的因素 在临床疗效研究中,患者在接受干预措施后所表现出的疗效并不一定单单是干预措施的特异 作用结果,而是受许多因素的综合影响. 早期的临床疗效研究多是病例分析性质的临床经验 总结,不设对照组,也不管疾病是否有自愈倾向,笼统地根据治疗后病情的变化用治愈率表 示疗效,这种研究方法是非常不严谨的,没有考虑到影响疗效的复杂因素. 影响疗效的因素 有许多,主要包括以下几方面.
, http://www.100md.com
2.1 干预措施 干预措施所引起的病情改善是临床疗效研究所要考核的核心内容. 研究者要确定干预措施本身对疾病的治疗作用,必须要了解干预措施本身所引起的效应到底有多大.
2.2 疾病的自行缓解 临床医师要评价干预措施的治疗效果,往往是根据疾病的自然病程或患者的预后来评价的. 然而目前许多疾病的自然病程还不能完全预料. 不同的疾病有不同的病理发生期、临床分期 特征及临床结局,既使同一种疾病在不同的患者中表现的类型、病程、严重程度、试验前的 治疗、并发症和预后也不一样. 例如,许多急性自限性疾病,如上呼吸道感染、急性胃肠炎、急性脑血管病,患者常症状明显时前来就诊,接受干预措施后病情的改善,很可能就是病 情自行缓解的结果,而不是干预措施的效应. 还有一些慢性迁延性疾病病程较长,病情常有 起伏,可自行缓解和活动,如果给予干预措施之后,恰好赶上疾病病情的缓解期,那么所表 现出来的病情好转也同样.
, 百拇医药
2.3 霍桑效应 霍桑效应(Hawthorne effect)是指某些患者因喜欢、迷信、讨好或厌恶某医师或医院而产生 正负两方面的影响. 如在观察比较某种新药的疗效时,如果不采用盲法,患者知道自己用 的是新药,从而对新药能治好他的病产生极大的期望,医师平时给予他的关照可能也较多, 医师在询问患者病情改善情况时,患者可能会因此而向医师报告好的结果,而实际上药物本 身的疗效并没有那么好.
2.4 安慰剂效应 安慰剂是指与所考核药物在外形、颜色和气味方面相同但不含己知有效成分的制剂,常用的 有淀粉及生理盐水注射液. 研究表明,在患者信任的情况下给予安慰剂,可以使30%的患者 的一些严重不适的症状得到减轻.
2.5 其他 包括研究对象的选择,观察测量的指标和方法,以及受试者的失访率等.由上述可见,在研究终点时所统计出来的疗效,往往是多种因素综合作用的结果. 成功的临 床疗效研究应能将以上不同的效应分开,充分显露干预措施的特异效应,消除和减少研究的 误差.
3 参考文献1 孙中行主编. 临床流行病学. 沈阳:辽宁省科学技术出版社,1996:175-179
2 洪明晃主编. 医学科学研究设计测量评价. 广州:中山大学出版社,1995:128-132, http://www.100md.com(李 强)