当前位置: 首页 > 期刊 > 《中国医学杂志》 > 1998年第6期
编号:10226948
五种中华医学会系列杂志的论著中科研设计类型的分析
http://www.100md.com 《中国医学杂志》 1998年第6期
     作者:张博恒 王倩

    单位:200032 上海医科大学附属中山医院肝癌研究所(张博恒);上海医科大学附属华山医院内科临床流行病室(王倩)

    关键词:临床试验;文献工作;期刊

    中华医学杂志980627

    【摘要】 目的 评价5种中华医学会系列杂志发表的科研论文中各种设计类型应用情况及其近十年来的变迁。方法 系统地评阅了1985年和1995年5种中华医学会系列杂志640篇和954篇论著,对其所报道的研究设计类型、存在的问题和10年来的变迁进行现况调查。结果 在1985年和1995年发表的1 594篇论著中,横断面研究和病例报道所占的比例都超过50%,纵向研究的比例约占1/3。与1985年相比,临床试验所占的比例从5.6%增加到11.3%,特别是临床对照试验(RCT)的比例从1.3%增加到4.2%;前瞻性研究的比例从3.9%上升到6.0%;回顾性研究的比例从25.0%降至13.9%,病例报告的比例更是由17.3%降至5.9%。在1985年和1995年的论著中研究设计明显存在问题的比例各为38.0%和36.8%。纵向研究存在的问题比例最高。5种最常见的科研设计问题依次为缺乏必要的对照或对照选择不合理、样本无代表性、结论依据不足、分组不随机及未考虑混杂偏倚。这五类问题占所有错误的66.9%。结论 近十年来医学研究中选择论证力较强的设计类型的比例有所提高,但总的比例仍然很低,同时在应用中存在不少问题,应引起足够的重视。
, http://www.100md.com
    Research reports in Chinese medical journals Zhang Boheng,Wang Qian. * CEU, Shanghai Medical University, Shanghai 200032

    【Abstract】 Objective To assess research designs employed in Chinese medical journals over the last decade. Method The types of study design used in all original articles published in five leading journals (sponsored by the Chinese Medical Association) in 1985 (n=640) and 1995 (n=954) were evaluated. Results Of 1 594 articles, over 50% were case reports and cross-sectional studies, and one third were longitudinal studies. Compared with 1985, the proportion of clinical trials increased from 5.6% to 11.3%, especially that of RCT increased from 1.3% to 4.2%. The proportion of prospective studies also increased from 3.9% to 6.0% and that of retrospective studies decreased from 25.0% to 13.9%, particularly, that of case series decreased from 17.3% to 5.9%. The inappropriate use of research design was frequent, the proportion of this problem was 38.0% and 36.8% for 1985 and 1995 respectively. The longitudinal studies were most liable to have this problem. The five commonly problems were the lack or inappropriateness of control, non-representativeness of sample, unbelievable conclusion, no randomization, and no consideration of confounders. They accounted for 66.9%. Conclusion The quality of research designs used in Chinese medical research is gradually improving in the last decade, but the lack or inappropriate use remains a serious problem.
, http://www.100md.com
    【Key words】 Research design Documentation Journal

    (Natl Med J China, 1998, 78:475-478)

    只有从完善的科研设计和严格执行的临床医学研究中得到的结果才能为临床实践提供指导。自70年代起,国外的一些医学杂志对发表的科研论文定期进行回顾性评阅分析,以了解论著中的科研设计类型应用情况及存在的问题。这些信息有助于改善科研设计和提高论文的质量。鉴于目前国内这方面工作开展不多,我们选择了国内有较高学术水平的5种医学期刊,对其中论著所报道的科研设计类型、存在的问题和10年来的变迁进行现况调查。

    材料与方法

    一、材料

    本调查选择了由中华医学会主编的5种医学系列杂志:中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志、中华心血管病杂志,对其中的每一篇论著进行评阅。共评阅了1985年640篇和1995年954篇论著。
, http://www.100md.com
    调查的内容包括每篇文章所报道的科研设计类型及存在的问题、统计方法的应用等。本文着重讨论所报道的科研设计类型。根据流行病学原理及有关文献[1~4],我们将文章的科研设计分为临床科研的纵向研究、横断面研究、病例报告和基础医学研究四大类(表1)。简单地说,纵向研究是调查结果变量随着时间不同的变化;横断面研究着重描述在某一固定时间的一种状态或现象。划分是横断面研究还是纵向研究并不是直接根据观察的时间长短,主要是根据结果是否随时间而变化。论文中研究对象少于10例,被列为病例报告[2]。基础医学研究包括药敏试验、动物研究、细胞培养以及其它分子生物学研究。

    二、质量控制

    表1 研究设计分类及1985年和1995年应用情况 科研设计类型

    1985年

    1995年
, 百拇医药
    论著数

    构成

    比(%)

    论著数

    构成

    比(%)

    病例报告

    95

    14.8

    72

    7.6

    纵向研究

    221
, http://www.100md.com
    34.5

    298

    31.2

    临床试验

    36

    5.6

    108

    11.3

    序列的

    自身对照

    8

    23

    交叉对照
, http://www.100md.com
    1

    2

    平行的

    随机对照试验

    8

    40

    非随机对照试验

    14

    38

    无对照

    5

    5

    前瞻性研究

, http://www.100md.com     25

    3.9

    57

    6.0

    疾病的病因和发生率

    2

    16

    无对照的干预试验

    14

    16

    疾病自然史

    6

    16
, 百拇医药
    预后研究

    3

    9

    回顾性研究

    160

    25.0

    133

    13.9

    病例对照研究

    5

    7

    病例分析

    111
, http://www.100md.com
    56

    回顾性的队列研究

    6

    10

    生存分析

    12

    7

    疗效评价

    19

    37

    预后研究

    7

    16

, 百拇医药     横断面研究

    272

    42.5

    452

    47.4

    疾病的描述及指标测定

    186

    344

    诊断试验

    50

    62

    标准值范围

    6
, http://www.100md.com
    3

    疾病的分类

    7

    5

    患病率

    23

    38

    基础医学研究

    52

    8.1

    132

    13.8

    动物实验
, 百拇医药
    随机对照实验

    12

    33

    非随机对照实验

    29

    51

    细胞培养

    5

    11

    药敏试验

    1

    6

    分子生物学实验
, http://www.100md.com
    0

    21

    新方法介绍及其它

    5

    10

    合计

    640

    100.0

    954

    100.0

    所有被评阅的文章均由作者之一按统一的调查表及分类表进行评阅,并经另一作者复查。如遇意见不一致之处,由两作者共同讨论分析,以求获得一致的结论。对其中100篇论著进行独立评阅的结果表明,两作者间对设计类型的评阅的一致率为85.0%,Kappa为0.79(P<0.01)。两作者间主要的分岐在于某些有关疗效评价的文章属于观察性的队列研究还是无对照的临床试验。由于某些论著中对于研究方法和设计的描述不够充分,一种治疗方法的给予是根据研究者的设计,还是常规治疗,而研究者仅是观察治疗的过程和结局,在判断中存在一定的困难。另外,一些对疾病治疗方法和预后进行总结的文章,通常收集有几年的病例但未说明是前瞻性还是回顾性观察研究,作者在判断上也存在一定的分歧。
, 百拇医药
    三、统计方法

    应用χ2检验比较1985年和1995年应用率的不同,所有的检验都为双侧检验,α=0.05。

    结果

    一、研究设计类型应用现况

    1985年和1995年论著研究设计类型的分类见表1。病例报告的比例从1985年的14.8%下降到1995年的7.6%(χ2=17.96,P<0.01)。文章中纵向研究的比例在1985年和1995年分别为34.5%和31.2%,差异无显著意义(χ2=1.89,P=0.169)。但是,其中临床试验的比例由5.6%上升到11.3%(χ2=15.11,P<0.01),特别是随机临床对照试验(RCT)的比例从1.3%上升到4.2%(χ2=11.35,P<0.01);前瞻性研究的比例由3.9%上升到6.0%(χ2=3.36,P=0.067);而回顾性研究的比例从25.0%下降到13.9%(χ2=31.20,P<0.01),尤其是单纯的病例分析的文章从17.3%下降到5.9%(χ2=53.73,P<0.01)。横断面研究的比例在1995年比1985年略有增加,但差异无显著意义(χ2=3.68,P=0.055),然而横断面研究中对疾病描述及指标测定方面的文章比例上升(29.1%对36.1%,χ2=8.45,P<0.01)。1995年中基础研究的比例高于1985年(χ2=12.23,P<0.01)。
, 百拇医药
    二、存在问题

    从表2可见,1985年和1995年发表的论著中研究设计或方法上存在问题的文章各占38.0%和36.8%,两年的差异无显著意义(χ2=0.23,P=0.63)。出现问题比例较高的研究类型为纵向研究,在1995年有近59.4%的纵向研究有设计和方法错误,高于其它研究类型(χ2=95.11,P<0.01)。

    表2 1985年和1995年设计应用不恰当的论著比例 科研设计类型

    1985年

    1995年

    χ2

    文章数

    有错(%)
, 百拇医药
    文章数

    有错(%)

    病例报道

    95

    7( 7.4)

    72

    4( 5.6)

    0.22

    纵向研究

    221

    123(55.7)

    298

    177(59.4)
, http://www.100md.com
    0.73

    临床试验

    36

    23(63.9)

    108

    71(65.7)

    0.04

    前瞻性研究

    25

    9(36.0)

    57

    26(45.6)

    0.65
, 百拇医药
    回顾性研究

    160

    91(56.9)

    133

    80(60.2)

    0.32

    横断面研究

    272

    101(37.1)

    452

    145(32.1)

    3.07

    基础医学研究
, 百拇医药
    52

    12(23.0)

    132

    25(18.9)

    0.40

    合 计

    640

    243(38.0)

    954

    351(36.8)

    0.23

    在这些研究设计和方法的问题中,最常见的依次为:缺少必要的对照组或对照不合理、样本无代表性、分组不随机、结论依据不足、未考虑混杂偏倚,这5类问题占所有错误的66.9%。无对照或对照不合理的问题主要存在于有关疗效评价及对治疗方法进行总结的文章中。这类文章常以医院内的回顾性病例总结为基础,根据治愈率得到某种治疗方法“有效”、“疗效较好”或“比其他治疗方法有效”的结论,通常未设立有效的对照组,如常规治疗组,或仅以自身前后比较作为对照。有些文章中非随机选择的对照组明显对结果存在偏倚。如中华外科杂志1995年33卷第2期《用24小时食管pH监测法诊断食管原性胸痛》一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH值监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露相关。得出食管pH监测是诊断胃食管反流所致的食管原性胸痛的有效方法。文中缺乏对照,如对照组24小时食管pH异常的发生率较高,则结论不正确。
, http://www.100md.com
    样本无代表性的问题主要存在于以某些特殊对象的结果去无限地推广,引起结果的偏性。在一些诊断试验评价的文章中,样本为典型的病例组和明确的非病例组而不是该诊断方法实际应用的对象,以这种方法选取的研究对象使得到的诊断准确率、敏感度和特异度等指标均高于实际水平。有些文章的研究对象来自某个医院但结论却扩展到整个人群。如中华儿科杂志1995年33卷第3期《武汉地区儿童呼吸道病毒感染的流行病学及临床特点研究》一文中,作者旨在调查武汉地区儿童呼吸道病毒感染的流行病学特点,而调查对象却为1978~1993年16年间武汉某(些)医院住院疑为呼吸道病毒感染的患儿。其样本只代表某(些)医院的住院可疑呼吸道病毒感染的患儿情况,而无法代表未住院的感染者和隐性感染的住院患儿的情况。所以,为了了解武汉地区儿童呼吸道病毒感染的流行病学特点,应在武汉地区的自然人群中作随机抽样进行调查。

    在临床试验中,随机对照试验仅占22.0%(8/36),而非随机分组的占39.0%(14/36)。如中华心血管病杂志1995年23卷第6期《重组组织型纤溶酶原激活剂静脉溶栓治疗急性心肌梗塞的临床观察》,作者选了溶栓组和对照组各30例,分别给药治疗。但这60例病人是如何选出的,如何分组,分组后两组的临床特征如何分布都未交代。
, 百拇医药
    未考虑混杂因素对研究结果的影响也是文章中常见的问题,尤其在评价治疗方法和疾病预后的文章中,通常仅分析不同治疗组中的疗效而未考虑各组中其他影响疗效的因素是否一致,如病人的基本情况、疾病严重程度等。在中华外科杂志1995年33卷第5期《股骨头缺血坏死患者的手术治疗》一文中,该科研的研究因素为不同的手术方式,结果因素为三项六级的评定标准。作者比较了术前、术后、不同术式、不同期别的三项指标的评定。作者考虑到不同期别对手术方式选择的影响,对结果评定的影响,但未进行进一步的处理。应用多元分析或其它统计方法可解决这个问题。

    其他的问题有缺少必要的统计分析、研究目的不明确、缺少疗效判断标准、失访者未交代等。 讨论

    本研究是1985年和1995年两个时点的断面调查,虽有机遇因素的影响,但比较客观地反映了近十年的变化。总的说来,近十年来发表的医学研究论文趋于选择论证力较强的设计类型。尽管从设计分类的统计结果看,在1995年的论著中纵向研究构成比较1985年略有下降,但这与回顾性研究减少特别是病例分析的病例数显著减少有关,并不说明目前研究设计类型应用趋向低效。在1995年的论著中,论证力强的设计类型如临床试验和前瞻性研究的比例较1985年增加,表明现在更多的研究者根据科研目的进行科研设计和收集资料,而不是仅应用以往的资料去回答问题。
, http://www.100md.com
    值得注意的是虽然近十年来较具研究价值的随机对照试验(RCT)在临床科研中的应用逐渐增多,但比例在总体上仍然很低,即使在动物实验中RCT也仅占40%左右。说明RCT的重要性仍未受到足够的重视。

    在所有临床研究中病例报告和横断面研究占了很大的比重,在1985年和1995年分别为57.0%和55.0%,在这10年中并未下降。相反,横断面研究的比例有一定的升高(从42.5%上升到47.4%)。其中主要是实验室指标检测的论著有增多的趋势。病例报告对某些少见病来说有其不可替代的地位。同样,横断面研究如诊断试验也是研究临床现象的常用方法。但这两者并不能代替纵向研究,反映疾病的病因学、自然史和治疗效果。

    本次调查表明了论著中报道的研究设计中存在的主要问题有缺少对照或对照不合理、样本选择缺乏代表性、试验分组不随机、文章的结论依据不足、未考虑混杂因素的影响等。建立在不完善的研究设计和研究方法上的结论可靠性较差,对临床实践可能产生误导,尤其对于疗效评价的文章,更要注意文章的科研方法是否完善。有些典型的研究方法如诊断试验评价在论著中所占的比例也较大,但在应用中存在不少问题。在1985年和1995年共有112篇文章涉及临床指标对诊断的价值,但很多文章存在缺少金标准、研究对象选择不合理及分析方法不正确等问题。规范的诊断试验评价的文章且很少见。我们同时注意纵向研究中出现研究设计及方法错误的比例最高。这种格局在近十年中并无改变。由于论证力较强的科研设计方法对研究实施的要求较高,也就更容易出现问题。因此,在提倡应用较完善的科研方法的同时,也应对临床科研者加强有关科研设计的教育。还要求杂志编辑人员在这方面严格把关,有助于进一步改善论著的质量。
, 百拇医药
    参考文献

    1 Bailar JC, Louis TA. A classification for biomedical research reports. N Engl J Med, 1984,311:1482-1487.

    2 Fletcher RH, Fletcher SW. Clinical research in General Medical Journals: A 30-years perspective. N Engl J Med, 1979,301:180-183.

    3 Vandenbroucke JP. Prospective or retrospective: What's in a name? Br Med J, 1991,302:249-250.

    4 McDermott MM, Levfere F, Feignlass J, et al. Changes in study design, gender issues, and other characteristics of clinical research published in three major medical journals from 1971 to 1991. J Gen Intern Med, 1995,10:13-16.

    (收稿:1997-09-08 修回:1997-12-01), http://www.100md.com