当前位置: 首页 > 期刊 > 《中华医学杂志》 > 1998年第3期
编号:10226902
五种中华医学会系列杂志论著中统计方法的应用现况
http://www.100md.com 《中国医学杂志》 1998年第3期
     作者:王倩 张博恒

    单位:200040 上海医科大学附属华山医院内科临床流行病室(王倩)上海医科大学附属中山医院肝癌研究所(张博恒)

    关键词:统计学;医学;期刊

    中华医学杂志980322 【摘要】 目的 了解在5种中华医学会系列杂志发表的论著中统计方法使用率、存在的问题以及近十年来的进展。方法 系统分析了1995年和1985年发表在以临床科研为主的5种医学期刊中的954篇和640篇论著。结果 1995年发表的论著较1985年有显著进步,文章中统计分析的使用率从40%上升到60%(χ2=60.9,P<0.001);使用了更多较复杂的统计分析方法;正确应用统计方法的比例从22%上升到46%(χ2=45.3,P<0.001)。在2年中t检验和联列表分析均为最常用的统计分析方法。最常见的问题是文章中仅有P值而所用统计方法不明、用t检验代替方差分析进行多组间的比较。结论 我国医学论著中使用统计分析方法的比例较10年前明显提高,1995年统计方法应用率与国外期刊类似,但在统计分析的应用中存在不少问题有待进一步改进。
, 百拇医药
    Current use of statistical methods in five core chinese medical journals Wang Qian*, Zhang Boheng. * Clinical Epidemiology Unit, Hua Shan Hospital, Shanghai Medical University, Shanghai, 200040

    【Abstract】 Objective To determine the frequency of statistical techniques used in Chinese medical journals, types of statistical errors present, and trends over a 10-year period. Methods We reviewed the statistical methods used in all original articles published in 5 leading journals in 1985 (n=640) and 1995 (n=954).Results Compared with 1985, significant improvement was seen in 1995. The proportion of papers using statistical tests increased from 40% to 60% (χ2=60.9,P<0.01), and more sophisticated statistical methods were used. Of those articles using statistics, the proportion using appropriate methods increased from 22% to 46% (χ2=45.3, P<0.01). In both years, the most commonly used statistical methods were t tests and contingency tables. The most common errors were presentation of P values without specifying the test used, use of multiple t tests instead of ANOVAs, and use of unpaired t tests when paired tests were required.Conclusion The use of statistical methods in Chinese medical journals is improving, and by 1995, the frequency of using statistical methods in published articles was similar to that in other journals around the world. However, the lack of or inappropriate sue of statistics remains a serious problem.
, 百拇医药
    【Key words】 Statistics Medicine Periodicals

    (Natl Med J China, 1998,78:230-233)

    近年来,医学统计方法的应用受到了广大医学工作者的重视,统计分析已成为医学科研报告中不可缺少的一个重要组成部分。然而,如果统计分析方法应用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。国外从70年代起就有不少研究对医学杂志上发表的文章进行科研设计和统计方法应用方面的分析[1~11],这种研究能及时了解科研论文的质量,发现存在的问题,有助于提高医学论文质量和提高医学科研人员应用统计方法的水平。鉴于目前国内这方面的报道较少,我们对国内具有较高学术水平的5种医学期刊发表的论著进行了分析,以了解我国医学论著中使用统计方法的现况、存在的问题以及近10年来的进展。

    材料和方法
, 百拇医药
    本调查选择了具有较高学术水平、发行量较大、以临床科研为主的5种医学期刊:中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志和中华心血管病杂志。本次调查仅涉及杂志的论著。共评阅了1995年发表的954篇和1985年发表的640篇论著。

    调查内容包括每篇文章的科研设计类型、根据文章的研究目的和结论判断该文章是否应该进行描述性以外的统计分析、使用的统计分析方法是否恰当、文章中是否有关于所用统计分析方法的描述、报告统计结果时是否有相关的统计量等。

    我们参考JohnBailar的分类[1]将常用的统计分析方法分为12类,见附表。对文章中未使用任何统计分析或仅对数据进行如均数、标准差、百分比等描述性统计的,均归为无统计分析类。方差分析包括协方差分析及方差分析后的组间比较。直接和间接寿命表以及生存曲线均归入寿命表分析;而其他生存分析包括Log-Rank时序检验和Cox风险模型。流行病学相关统计分析包括相对危险度计算、诊断试验中的敏感度、特异度分析等。因仅极少数文章用判别分析、率的标化、样本量计算和数学模型拟合,这些方法均归入其他类。按附表所列分类记录每篇文章使用的统计方法。若在同一文章出现不同的统计方法都分别记录,而在同一文章中重复使用一种统计分析方法的仅记录一次。
, 百拇医药
    附表 1995年和1985年5种

    期刊论著中使用的各种统计分析方法及比例 统计分析方法分类

    1995年

    1985年

    论文数

    %

    论文数

    %

    刊出论著文章数

    954

    640

    未使用统计分析方法或仅用描述性统计
, 百拇医药
    381

    383

    使用统计分析方法

    573

    257

    t-检验

    364

    63.5

    171

    66.5

    联列表分析

    221

    38.6
, 百拇医药
    87

    33.9

    线性相关分析

    96

    16.8

    36

    14.0

    方差分析

    96

    16.8

    15

    5.8

    流行病学相关统计分析
, 百拇医药
    23

    4.0

    5

    1.9

    多元回归分析

    20

    3.5

    5

    1.9

    简单线性回归

    18

    3.1

    15
, 百拇医药
    5.8

    非参数统计

    16

    2.8

    2

    0.8

    生存分析

    11

    1.9

    3

    1.2

    数据转换

    8

, 百拇医药     1.4

    0

    0.0

    趋势检验

    7

    1.2

    0

    0.0

    其他统计检验方法

    8

    1.4

    1

    0.4

    %为使用各类统计分析方法的文章数占该年使用了统计分析方法文章总数的百分比
, http://www.100md.com
    所有被评阅的文章均由作者之一按统一的调查表及分类表进行评阅,并经另一作者复查。如遇意见不一致之处,由两作者共同讨论分析,得到一致的结论。对其中100篇论著进行独立评阅的结果表明两作者间评阅一致率为91%,Kappa为0.89(P<0.01)。

    用卡方检验比较1985年与1995年发表的文章中统计方法使用率的区别。

    结果

    一、医学论著中统计分析方法的应用现况

    在1995年发表的954篇论著中,573篇(60%)应用了统计分析(附表)。未用统计方法的381篇论文中有93篇为缺少必要的统计分析,71篇为病例报告、217篇为描述性研究,仅对研究结果的均数、标准差或频数等进行描述性统计报告。在1985年发表的文章中,统计方法的使用率仅为40%,明显低于1995年(χ2=60.9,P<0.01)。在未用统计分析的883篇文章中有60篇属缺少必要的统计分析。
, 百拇医药
    1985年和1995年发表的文章中,最常用的统计方法均为t检验,其次是联列表分析、线性相关分析和方差分析,其他统计方法的使用率均低于2.5%(附表)。1995年的论著中所用统计分析方法比1985年较复杂、更丰富。如应用多元回归分析的文章比1985年多。1985年3篇生存分析的文章皆为寿命表分析,而1995年生存分析的文章中有3篇Cox回归分析。在1985年,除t检验外,多用联列表分析、方差分析、直线相关分析和简单线性回归分析这些常用的统计方法,使用其他类型统计分析方法的文章仅16篇,占所有使用了统计分析的文章的6.2%,明显低于1995年(14.8%)(χ2=12.3,P<0.01)。在同一篇文章中使用两种或更多统计方法的文章在1995年有260篇,占总数27.3%,而在1985年仅有63篇,占9.8%,低于1995年(χ2=71.9,P<0.01)。

    二、统计分析方法应用中存在的问题

    根据文章的研究目的以及所得到的结论判断,在1995年和1985年的文章中各有666和317篇文章应该进行统计分析。但分别有93篇(14%)和60篇(19%)文章未进行必要的统计分析。如中华心血管病杂志1995年23卷第5期《应用原位杂交法探讨肠道病毒感染与扩张型心肌病的关系》一文中,“40例心肌活检标本中有18例出现杂交信号,5例正常心肌对照标本与该探针杂交均为阴性……,证明扩张型心肌病的发生与肠道病毒感染特别是柯萨奇病毒感染有密切关系”,但文中未进行统计学检验。若经校正卡方检验可发现,两组的阳性率差异并未达到统计学检验的显著性水平。在中华外科杂志1995年第33卷第1期《同种异体小肠移植的实验研究和临床应用》一文中,动物实验部分比较各实验组间观察指标均未检验,结果中有关血清生化改变部分“Ⅱ组术后40、70天的GPT和GOT均高于术前,并显著高于Ⅳ组”,同样缺少统计学检验而且无具体数值。这种缺少必要的统计分析的文章所占的比例在1995年比1985年有所下降(χ2=4.03,P<0.05)
, http://www.100md.com
    在使用了统计分析方法的文章中,存在各种不恰当应用统计分析方法。但1995年的论著中正确应用统计方法的比例(46%)比1985年(22%)上升(χ2=45.3,P<0.01)。最常见的问题是文章中既无所用统计方法的描述又无相关统计量,仅有P值,造成使用的统计方法不明。如中华妇产科杂志1995年30卷第6期《人卵巢癌细胞雄激素受体测定及性激素对性别增殖的影响》一文中,结果部分有关性激素对H-8910细胞增殖的影响,有P值表明经性激素作用后HO-8910细胞的A57值略有增加,但文中无所用统计方法描述及统计量,无法知道是用t检验、方差分析或非参数统计方法进行分析。在1995年和1985年使用了统计分析的文章中分别有28%和56%存在这个问题。

    出现统计方法应用错误的文章在1985年有24%,而在1995年为36%。常见问题有:(1)用t检验代替方差分析进行多组间的比较。如中华心血管病杂志1995年23卷第6期《穿心莲成分API0134对猪主动脉平滑肌细胞增殖的抑制作用》一文,附表中对照组、HLS组、Iloprost组间各指标(PAI活性、CAMP含量等)应该用方差分析对三组间的各种指标进行比较而不是用t检验进行各组间两两比较;(2)用成组t检验代替配对t检验,如中华儿科杂志1995年33卷第4期《应用经导管动脉导管双面伞器堵闭术治疗动脉导管未闭12例》一文中,比较手术前后平均动脉压等指标的变化应该用配对t检验,同时还应列出手术前后差值的均数及标准差;(3)数据为偏态分布,却用t检验或方差分析。如中华儿科杂志1995年第33卷第5期《白细胞介素1和垂体-肾上腺皮质轴在原发性肾病综合征中的变化》一文中,材料方法部分已交代数据呈非正态分布,两组的样本量分别为9和18,用t′检验进行分析;(4)在使用多元回归分析的文章中,存在所用分析方法的名称不详(如是Logistic回归还是多元线性回归)、变量定义不明、自变量选择不恰当(如变量间存在自相关或不恰当的因果关系)、在结果变量为二分变量时使用多元线性回归等问题;有的文章在结果中仅列出多元回归分析的P值而无回归分析的结果或有关的重要参数。以中华外科杂志1995年33卷第2期《骨肉瘤患者的预后因素》一文为例。文中用多元线性回归进行统计分析。该文较明显的优点是将回归分析的应变量和自变量的编码方法一一列在表中,同时对回归分析的方法有明确的描述,并对统计结果作了解释。该文中较大的问题是应变量为“预后”,即死亡或存活,是二分变量而不是连续变量,这种情况应该用Logistic回归分析而不是“线性回归”。预后的编码通常是1和0。另外,在对自变量的赋值中,作者将一些无序的分类变量定义为连续变量,如“X线分型:溶骨型=1;硬化型=2;混合型=3”。其实这三种不同的X线分型对骨肉瘤预后的作用不一定呈定量递增的,应该以“哑元”(dummy variable)的形式定义变量。其它错误有使用简单线性回归分析未列出回归方程及有关统计量、对回归结果无应有的解释和结论;仅列P值和结论但无具体统计数据;应用的统计方法不恰当,如部分有关治疗评价和诊断试验评价的文章仅用线性相关分析;对P值的理解错误,认为P值越小组间差异越大等。
, 百拇医药
    讨论

    在所调查的1995年发表的文章中有60%使用了的统计分析,比1985年的40%有显著增加。两年的论著中t检验和卡方检验均为最常用的统计分析方法,方差分析和线性相关分析也较常见。Emerson等[1]对在New England Journal of Medicine1979年发表的332篇论著进行评阅,结果有73%的文章应用统计分析。但这些文章中不包括病例报告。假如本次调查的1995年的论著中去除72篇病例报告文章,统计方法使用率上升为65%,稍低于Emerson等的报道。其他一些国外医学杂志类似的调查得到的统计分析使用率从23%到66%不等[5,7,10]。总的看来,文章中统计分析的使用率与杂志的专科和论著的研究设计类型有密切关系。我们所调查的5种中华医学会系列期刊中统计方法的使用率不低于国外同类期刊,常用统计分析方法的顺位也与国外报道相类似[1,2,6,7,11]。但我们的论著中t检验和联列表分析(主要为卡方检验)所占的比例更大。复杂些的统计方法甚至包括方差分析都用的较少。Rosenfeld等[11]和Juzych等[7]的调查比较了不同年代的论著,发现90年代的文章中用复杂的统计分析方法比70、80年代有显著增多。我们的调查也有类似的发现,估计在我国的医学期刊中使用的统计方法会越来越丰富。
, 百拇医药
    尽管1995年论著中统计分析使用的比例和正确率比1985年有明显增加,但仍存在各种不恰当之处。许多错误是出现在常用统计方法的应用中,如以t检验代替方差分析,卡方检验代替精确概率法等。在1995年发表的文章中仅16篇文章使用了非参数统计,8篇文章进行了数据转换,这些比例明显低于国外文献报道[1,2,11]。而另有些文章的数据偏态分布却用t检验或方差分析。由于大部分文章的数据分布无法从文章中得知,不符合检验假设的比例可能更高。由此我们推测,非参数统计方法的低使用率与忽略参数统计方法必要条件有关。文章中仅有P值而应用的统计方法不明的现象在其他调查中也是较常见的问题[2,5,8,10]。随着科研设计方法的完善,一些特定统计分析方法应被更广泛地应用于科研报告中,如生存分析中的COX回归分析、多元回归分析、与流行病研究相关的危险度分析、诊断试验评价中的ROC曲线等,但在提倡和推广使用这些较复杂的统计分析时,应注意强调医学科研人员与统计专业人员之间的合作。

    在1995年发表的文章中统计方法使用不当的文章所占比例高于1985年,可能与1995年统计分析使用率上升、使用的统计方法增多有关;另一原因是1985年使用统计方法不详的文章较多。
, http://www.100md.com
    从本次调查中我们得到这样的印象,许多不恰当或错误使用统计分析方法问题均与科研设计不完善有关。我们认为要提高医学论著中统计方法应用的质量,应强调明确科研目的、选择正确的科研方案,在进行统计分析时应了解特定的统计检验方法的假设和条件,应正确地表达统计分析的结果并从结果中得到恰当的结论。

    在调查中我们还注意到在同一杂志中往往存在类似的问题,例如结果中仅有P值而无统计量、方法描述中缺乏有关所用统计方法的描述等。而不同杂志的文章在统计方法应用和科研设计上的质量也存在差异。说明对编辑和评审人员进行相应的培训有助于提高杂志中文章的质量。

    本次调查表明,这5种中华医学会系列杂志的论著中使用统计分析方法的比例较10年前明显提高,应用的统计方法也更丰富。但是尚存在不少问题有待进一步改进。

    参考文献

    1 Emerson JD, Colditz GA. Use of statistical analysis in the New England Journal of Medicine. N Engl J Med, 1983, 309:709-713.
, 百拇医药
    2 Schwart SJ, Sturr M, Golberg G. Statistical methods in rehabilitation literature: A survey of recent publications. Arch Phys Med Rehabil, 1996,77:497-500.

    3 Wainapel SF, Kayne HL. Statistical methods in rehabilitation research. Arch Phys Med Rehabil, 1985, 66:332-334.

    4 Fletcher RH, Fletcher SW. Clinical research in general medical journals: A 30-year perspective. N Engl J Med, 1979, 301:180-183.
, http://www.100md.com
    5 Morris RW. A statistical study of papers in the journal of bone and joint surgery [BR]1984. J Bone Joint Surg, 1988, 70B:242-246.

    6 Feinstein AR. Clinical biostatistics. XXV. Survey of statistical procedures in general medical journals. Clin Pharmacol Ther, 1974,15:97-107.

    7 Juzych MS, Shin DH, Seyedsadr M, et al. Statistical techniques in Ophthalmic Journals. Arch Ophthalmol, 1992, 110:1225-1229.
, 百拇医药
    8 Bailar JC, Mosteller F. Guidelines for statistical reporting in articles for medical journal: Amplifications and explanations. Ann Intern Med,1988, 108:266-273.

    9 Avram MJ, Shanks CA, Dykes MHM, et al. Statistical methods in anesthesia articles: an evaluation of two American journals during two six-month periods. Anesth Analg, 1985,64:607-11.

    10 Kanter MH, Taylor JR. Accuracy of statistical methods in transfusion: areview of articles from July/August 1992 through June 1993, Transfusion, 1994, 34:697-701.

    11 Rosenfeld RM, Rockette HE. Biostatistics in Otolaryngology Journals. Arch Otolaryngol Head Neck Surg, 1991, 117:1172-1176.

    (收稿:1997-08-22 修回:1997-12-01)

    , 百拇医药