临床试验中纵向缺失数据不同处理策略统计性能的比较
协方差,数据处理,1资料和方法,2模拟试验结果,3讨论
赵淑珍,金东镇,李慧慧,赖梦园,黄若谷,毛广运,21.温州医科大学 公共卫生与管理学院 预防医学系,浙江 温州 325035;2.温州医科大学附属眼视光医院 国家眼部疾病临床医学研究中心,浙江 温州 325027
新药临床试验研究中,受试者由于各种原因而中途脱落的现象极为常见,由此导致的数据缺失问题不可避免地影响着研究结论的准确性和可靠性[1]。虽然缺失数据的处理一直是统计学的重要研究热点之一,但目前尚未达成针对缺失数据处理的共识。临床科研实践中对缺失数据的处理方式往往较为简单,甚至带有个人偏好[2],其中尤以盲目删除缺失数据的相关记录和使用末次观测结果进行结转最为常见[3]。研究发现,简单地删除缺失记录不仅可能会导致统计学把握度(Power)的降低,增加假阴性结论的发生风险,还可能因破坏了随机性及降低样本的代表性,给试验结果带来不可忽视的偏倚效应[4]。此外,末次结转的前提条件是数据缺失的机制必须为完全随机缺失,事实上很少有研究能满足这一要求,并且由于该方法中的效应估计相对保守,甚至会较大程度影响到研究结论的准确性[5]。多年来,尽管各种缺失数据的处理方式不断涌现[6-8],但由于均未同时充分考虑缺失模式、缺失机制及缺失比例的影响,尚无能够完美解决临床试验中数据缺失问题的方法被广泛认可。本研究旨在基于电脑模拟数据,深入分析评估不同处理策略在相关数据缺失模式、机制和比例下的性能,为科学合理地处理新药临床试验的缺失数据提供依据。
1 资料和方法
1.1 数据模拟方法 根据CHRIS等[9]提供的SAS代码生成完整双臂优效性临床试验模拟数据集,数据基本情况见表1,变量包括受试者编号、年龄、性别、访视时间和结局水平测量。其中性别及组别由伯努利分布随机生成,总样本量为500,其中安慰剂组262例,试验组238例,女220例,男280例;年龄和基线指标由正态分布随机生成,年龄分布为(48.6±15.2)岁,基线目标水平为(99.95±10.74)。访视时间分别为基线、给药后1、2、4、6、14 周。访视过程中对照组后续随访每次目标水平的测量由均数为100、标准差为10的正态分布随机数替代,而试验组访视过程中目标水平的测量由上一访视时间点的测量结果加上新的均数为10,标准差为2的正态分布随机数替代,完整数据集在各个时点表现见表2。将上述完整模拟数据集分别处理成完全随机缺失和随机缺失机制下的任意缺失模式和单调缺失模式。考虑到很少有临床试验的数据缺失比例会超过15%,故此分别设置了0%~10%、5%~10%和10%~15%三个等级数据缺失比例展开相关研究 ......
您现在查看是摘要页,全文长 11158 字符。