IDEAL研究结果分析带来更多质疑
IDEAL研究自实施之日起就伴随着对其试验设计的不同声音,及至结果在2008年欧洲肝脏研究学会(EASL)年会上正式公布的结果显示,就主要疗效评价指标:持续病毒学应答(SVR)率和安全性,3种治疗方案无显著差异。该试验研究人员进一步分析显示,聚乙二醇干扰素(PEG-IFN)α-2a(派罗欣)组的治疗结束时应答(EOT)率较高,而PEG-IFNα-2b组的复发率较低。针对这一结果,许多学者进行了再分析,然而却得出了并不一致的结论,其原因何在?IDEAL的试验设计又有什么问题呢?本文试做如下阐述。
IDEAL研究旨在评判PEG-IFNα-2b的最佳给药剂量(1.0 μg/kg和1.5 μg/kg),同时对比派罗欣与PEG-IFNα-2b的疗效。
试验研究人员对结果分析指出,派罗欣组39%的患者利巴韦林(RBV)初始剂量较高,而PEG-IFNα-2b组则有10%的患者RBV初始剂量高。EOT率、复发率和SVR率分别为:PEG-IFNα-2b 1.5 μg/kg组53.2%、23.5%和39.8%;PEG-IFNα-2b 1.0 μg/kg组49.2%、20%和38%;派罗欣组64.4%、 31.5%和 40.9%。各组SVR率没有显著差异。各组治疗12周或48周累计RBV暴露量>60%的患者比例分别为:PEG-IFNα-2b 1.5 μg/kg组91.3%和59.2%;PEG-IFNα-2b 1.0 μg/kg组94.5%和55.5%;派罗欣组95.3%和66.3%。促红细胞生成素(EPO)的使用率各组相似(16%~17%)。
, 百拇医药
该研究的试验设计在过去的几年中被各国专家广泛讨论,其焦点集中在两种PEG-IFN联合不同起始剂量的RBV、减量方案以及相关的EPO处理原则。
质疑1 IDEAL研究是否为两种PEG-IFN的头对头比较研究?
IDEAL研究支持者认为该研究为大型头对头比较研究。然而,该研究主要研究者之一McHutchison在2005年就指出,两种PEG-IFN组间的RBV剂量和剂量调整方案存在较为明显的偏差,使得RBV剂量有利于PEG-IFNα-2b组。
良好的试验设计是临床研究获得正确结论的基础,IDEAL研究最常被质疑的就是其试验设计上的某些不足。什么是良好的试验设计呢?意大利学者Ascione独立开展的对比两种PEG-IFN疗效的前瞻性随机对照临床试验是一范例。
Ascione研究比较派罗欣(180 μg/w)与PEG-IFNα-2b(1.5 μg/kg)分别联合利巴韦林治疗慢性丙肝初治患者的疗效。研究入组320例患者,感染基因1或4型的患者接受48周治疗,感染基因2或3型的患者接受24周治疗,进行意向治疗(ITT)结果分析。在该研究中,两组RBV剂量一致,其减量原则也完全一样,试验的可变因素仅为使用不同的PEG-IFN(图1)。
, http://www.100md.com
如果IDEAL研究能够和上述Ascione的研究一样,消除RBV的非试验因素,直接对比两种PEG-IFN的疗效,才是真正意义上的头对头研究。 而Ascione研究结论显示,派罗欣组和PEG-IFNα-2b组的总体SVR率分别为68.7%和54.4%,P值有显著差异,派罗欣疗效显著高于PEG-IFNα-2b(图2)。
因此,由于IDEAL研究中PEG-IFNα-2b和派罗欣组的RBV起始剂量不等,减量原则不同,IDEAL研究并不是真正意义上的头对头研究。
质疑2 第4周达RVR、第12周达cEVR患者的SVR预测是否有意义?
IDEAL研究中派罗欣和PEG-IFNα-2b两组第4周达快速病毒学应答(RVR)的患者例数分别为123、116、79,第12周达完全早期病毒学应答(cEVR)患者例数分别为466、407、366,派罗欣组均高于PEG-IFNα-2b组,提示派罗欣有更强的病毒清除能力。而这些患者中最终达SVR的比例分别为80%、92%、87%和74%、81%、83%,PEG-IFNα-2b的SVR预测性高于派罗欣。然而,7%~12%的差别仅有9~16个病例,同时由于比较的亚组患者数量不等,无法得出有统计学差异的结论。
, http://www.100md.com
因此,在缺乏有统计学意义数据证实的情况下,这些差异的预测价值无法得出任何有意义的结论。
质疑3 IDEAL研究中RBV累计剂量的计算方法是否合理?
IDEAL研究结论显示,完成48周治疗的患者RBV累计剂量>60%的比例仅为59%~66%,这主要是由于治疗中因无应答或治疗中无法耐受RBV而停药的患者比例高,从而降低了该组的RBV用量,这种RBV累计剂量的计算方法无法正确评价RBV对疗效的影响。而在IDEAL研究中,PEG-IFNα-2b组在治疗中未获得应答的患者比例为47%~51%,远高于派罗欣组的36%。
然而,因为IDEAL研究中RBV起始剂量和减量方案的不同,使得分析RBV浓度对疗效的影响复杂化。例如派罗欣治疗的40~65 kg和75~85 kg亚组患者RBV剂量分别为1000 mg/(kg·d)和1200 mg/(kg·d),高于PEG-IFNα-2b组的800 mg/(kg·d)和1000 mg/(kg·d),但是派罗欣组的轻体重患者由于发生RBV副作用而减量的可能性却会增加。
, 百拇医药
试验规定减量后可同时使用EPO以预防RBV副作用,但在减量后使用也会造成RBV累计剂量的不足。
我们期望得到不同体重亚组完成全疗程病例的RBV不同累计剂量之间的对比情况,以及相应的治疗结束时病毒学应答率、SVR率和复发率的分析,但是截至目前尚没有这方面的所有数据。
质疑4 如何认识IDEAL研究中复发率对于疗效的意义?
IDEAL研究的3个研究组SVR率相同,派罗欣组复发率高于PEG-IFNα-2b组。在EASL年会上,研究者并未发现3组的复发率是否具有统计学差异。
在丙肝治疗的研究中,复发率=(EOT-SVR)/EOT。因此可推测PEG-IFNα-2b组无应答或停药退出研究的患者比例高于派罗欣组(图3)。另外,由于RBV剂量的偏差,使得派罗欣组缓慢病毒学应答(12周HCV RNA下降>2 log10而未发生转阴,24周时才发生HCV RNA转阴)的患者比例高于PEG-IFNα-2b组(17%对11%)。而有研究表明,48周的治疗,缓慢病毒学应答者的复发几率高于12周即发生病毒学应答者,而IDEAL试验中,由于RBV剂量的偏差使本可以获得早期病毒学应答的患者比例下降。
在这些患者中,如果提高相应RBV剂量,或对缓慢病毒学应答的患者延长疗程,将能够进一步提高派罗欣组的SVR率。而PEG-IFN α-2b组可能需要的是如何降低治疗无应答患者的比例。相对降低复发率而言,这无疑更困难。
综上所述,IDEAL研究并不是设计合理的头对头研究,由于试验设计的缺陷在RBV起始剂量、减量方案中存在有利于PEG-IFNα-2b组的偏差。由于RBV对两种干扰素的成功治疗都有明确的影响,目前已经公布的研究结果使临床医生产生了对该研究结论的诸多质疑,该试验目前不可能获得任何关于两种干扰素疗效之间差异的正确结论。, 百拇医药
IDEAL研究旨在评判PEG-IFNα-2b的最佳给药剂量(1.0 μg/kg和1.5 μg/kg),同时对比派罗欣与PEG-IFNα-2b的疗效。
试验研究人员对结果分析指出,派罗欣组39%的患者利巴韦林(RBV)初始剂量较高,而PEG-IFNα-2b组则有10%的患者RBV初始剂量高。EOT率、复发率和SVR率分别为:PEG-IFNα-2b 1.5 μg/kg组53.2%、23.5%和39.8%;PEG-IFNα-2b 1.0 μg/kg组49.2%、20%和38%;派罗欣组64.4%、 31.5%和 40.9%。各组SVR率没有显著差异。各组治疗12周或48周累计RBV暴露量>60%的患者比例分别为:PEG-IFNα-2b 1.5 μg/kg组91.3%和59.2%;PEG-IFNα-2b 1.0 μg/kg组94.5%和55.5%;派罗欣组95.3%和66.3%。促红细胞生成素(EPO)的使用率各组相似(16%~17%)。
, 百拇医药
该研究的试验设计在过去的几年中被各国专家广泛讨论,其焦点集中在两种PEG-IFN联合不同起始剂量的RBV、减量方案以及相关的EPO处理原则。
质疑1 IDEAL研究是否为两种PEG-IFN的头对头比较研究?
IDEAL研究支持者认为该研究为大型头对头比较研究。然而,该研究主要研究者之一McHutchison在2005年就指出,两种PEG-IFN组间的RBV剂量和剂量调整方案存在较为明显的偏差,使得RBV剂量有利于PEG-IFNα-2b组。
良好的试验设计是临床研究获得正确结论的基础,IDEAL研究最常被质疑的就是其试验设计上的某些不足。什么是良好的试验设计呢?意大利学者Ascione独立开展的对比两种PEG-IFN疗效的前瞻性随机对照临床试验是一范例。
Ascione研究比较派罗欣(180 μg/w)与PEG-IFNα-2b(1.5 μg/kg)分别联合利巴韦林治疗慢性丙肝初治患者的疗效。研究入组320例患者,感染基因1或4型的患者接受48周治疗,感染基因2或3型的患者接受24周治疗,进行意向治疗(ITT)结果分析。在该研究中,两组RBV剂量一致,其减量原则也完全一样,试验的可变因素仅为使用不同的PEG-IFN(图1)。
, http://www.100md.com
如果IDEAL研究能够和上述Ascione的研究一样,消除RBV的非试验因素,直接对比两种PEG-IFN的疗效,才是真正意义上的头对头研究。 而Ascione研究结论显示,派罗欣组和PEG-IFNα-2b组的总体SVR率分别为68.7%和54.4%,P值有显著差异,派罗欣疗效显著高于PEG-IFNα-2b(图2)。
因此,由于IDEAL研究中PEG-IFNα-2b和派罗欣组的RBV起始剂量不等,减量原则不同,IDEAL研究并不是真正意义上的头对头研究。
质疑2 第4周达RVR、第12周达cEVR患者的SVR预测是否有意义?
IDEAL研究中派罗欣和PEG-IFNα-2b两组第4周达快速病毒学应答(RVR)的患者例数分别为123、116、79,第12周达完全早期病毒学应答(cEVR)患者例数分别为466、407、366,派罗欣组均高于PEG-IFNα-2b组,提示派罗欣有更强的病毒清除能力。而这些患者中最终达SVR的比例分别为80%、92%、87%和74%、81%、83%,PEG-IFNα-2b的SVR预测性高于派罗欣。然而,7%~12%的差别仅有9~16个病例,同时由于比较的亚组患者数量不等,无法得出有统计学差异的结论。
, http://www.100md.com
因此,在缺乏有统计学意义数据证实的情况下,这些差异的预测价值无法得出任何有意义的结论。
质疑3 IDEAL研究中RBV累计剂量的计算方法是否合理?
IDEAL研究结论显示,完成48周治疗的患者RBV累计剂量>60%的比例仅为59%~66%,这主要是由于治疗中因无应答或治疗中无法耐受RBV而停药的患者比例高,从而降低了该组的RBV用量,这种RBV累计剂量的计算方法无法正确评价RBV对疗效的影响。而在IDEAL研究中,PEG-IFNα-2b组在治疗中未获得应答的患者比例为47%~51%,远高于派罗欣组的36%。
然而,因为IDEAL研究中RBV起始剂量和减量方案的不同,使得分析RBV浓度对疗效的影响复杂化。例如派罗欣治疗的40~65 kg和75~85 kg亚组患者RBV剂量分别为1000 mg/(kg·d)和1200 mg/(kg·d),高于PEG-IFNα-2b组的800 mg/(kg·d)和1000 mg/(kg·d),但是派罗欣组的轻体重患者由于发生RBV副作用而减量的可能性却会增加。
, 百拇医药
试验规定减量后可同时使用EPO以预防RBV副作用,但在减量后使用也会造成RBV累计剂量的不足。
我们期望得到不同体重亚组完成全疗程病例的RBV不同累计剂量之间的对比情况,以及相应的治疗结束时病毒学应答率、SVR率和复发率的分析,但是截至目前尚没有这方面的所有数据。
质疑4 如何认识IDEAL研究中复发率对于疗效的意义?
IDEAL研究的3个研究组SVR率相同,派罗欣组复发率高于PEG-IFNα-2b组。在EASL年会上,研究者并未发现3组的复发率是否具有统计学差异。
在丙肝治疗的研究中,复发率=(EOT-SVR)/EOT。因此可推测PEG-IFNα-2b组无应答或停药退出研究的患者比例高于派罗欣组(图3)。另外,由于RBV剂量的偏差,使得派罗欣组缓慢病毒学应答(12周HCV RNA下降>2 log10而未发生转阴,24周时才发生HCV RNA转阴)的患者比例高于PEG-IFNα-2b组(17%对11%)。而有研究表明,48周的治疗,缓慢病毒学应答者的复发几率高于12周即发生病毒学应答者,而IDEAL试验中,由于RBV剂量的偏差使本可以获得早期病毒学应答的患者比例下降。
在这些患者中,如果提高相应RBV剂量,或对缓慢病毒学应答的患者延长疗程,将能够进一步提高派罗欣组的SVR率。而PEG-IFN α-2b组可能需要的是如何降低治疗无应答患者的比例。相对降低复发率而言,这无疑更困难。
综上所述,IDEAL研究并不是设计合理的头对头研究,由于试验设计的缺陷在RBV起始剂量、减量方案中存在有利于PEG-IFNα-2b组的偏差。由于RBV对两种干扰素的成功治疗都有明确的影响,目前已经公布的研究结果使临床医生产生了对该研究结论的诸多质疑,该试验目前不可能获得任何关于两种干扰素疗效之间差异的正确结论。, 百拇医药