当前位置: 首页 > 期刊 > 《中国卫生统计》 > 1999年第2期
编号:10260007
单因素多样本比较方法的选择
http://www.100md.com 《中国卫生统计》 1999年第2期
     作者:黄水平

    单位:徐州医学院卫生教研室(221002)

    关键词:检验效能;稳健性;Monte Carlo法

    中国卫生统计990204 【提 要】 目的 单因素多个样本的比较方法很多。若使用不当会出现以下两个矛盾:(1)多个样本检验总的有差别,而两两比较却没有一组有差别;(2)多个样本检验总的无差别,而两两比较却有差别。本文通过模拟实验对上述问题进行研究。方法 选取8种单因素多个样本检验方法,用Monte Carlo模拟抽样方法,模拟了不同分布、不同方差及不同均数等情况。并以各种检验方法之效能和误差为观察指标。结果 给出了8种检验方法的Ⅰ型和Ⅱ型误差估计值。结论 提出了实际工作中方法的选择:当备择假设为有序时,可首选Jonckhere-Terpsta检验;当备择假设为无序时,若考虑效能强弱,可首选秩转换检验,若考虑误差大小,可首选W.H.Kruskal检验。
, 百拇医药
    Selection of One-Way-Multiple-Sample Tests

    Huang Shuiping,Xuzhou Medical College(221002).Jiangsu

    【Abstract】 Objective There are many One-Way-Multiple-Sample tests.If a proper test is not selected,two contradictions are arised:(1)There is difference in multiple populations with a multiple sample tests,but there is not difference in any two populations with a multiple comparison;(2)Contrary to (1).this essay studied the The problem above mentiond is studied in this essay.Methods 8 one-way-mutiple-sample tests were selected.The conditions of different distribution,variance and average were simulated by means of Monte Carol method.using the power and error of the test as the index for comparison.Results The type Ⅰ error and type Ⅱ error estimate of 8 one-way -multiple-sample tests are given.Conclusion Introduces how to select these tests:When alternative hypothsis is ordered,the Jonckhere-terpsta test is first selected;When alternative hypothesis is not ordereed,and power of test only concerned,the rank transformation test is first selected,but error of test concerned,the W.H.Kruskal test is first selected.
, 百拇医药
    【Key words】 Power Robusness Monte Carlo method

    在医学研究中,常常碰到单因素(完全随机设计)多个样本的比较。传统的比较分析方法是方差分析两两比较。但作这些分析时要求资料满足正态分布且方差齐性,而实际资料往往难以满足这些条件,这就需要用非参数检验去分析。非参数检验方法很多,有些方法从模型上作了一些近似。因此若检验方法选择不当会出现以下两个矛盾:(1)多个样本检验总的有差别,而两两比较却没有一组有差别。(2)多个样本检验总的无差别,而两两比较却有差别。本文通过模拟实验对上述问题进行研究。

    模拟实验方法

    (一)供选择的检验方法

    本文选取了8种检验方法。①方差分析(ANOV);②W.H.Kruskal检验(H);③秩转换检验(RT)〔1〕;④多组秩和检验(MR)〔2〕;⑤Randomized Statistics检验(RS)〔3〕;⑥Jonckhere-Terpsta检验(JT)〔4〕;⑦Crouse检验(一)(CR1)〔5〕;⑧Crouse检验(二)(CR2)〔5〕
, 百拇医药
    (二)模拟实验的设计

    总体分布取标准差差值(λ)分别为0,1,7的正态分布(3种)和偏度系数(CR)分别为0.78,1.75及6.19的对数正态分布(3种)。总体个数(样本个数K)取3及4两种。样本例数分别取相等与不等两种,最大例数为20,最小为5。具体见表1,并设计了例数与标准差顺向与反向两种。如σi=(1,2,3),ni=(7,10,13)为顺向,σi=(1,2,3),ni=(13,10,7)为反向。总体均数分别取相等、全部差与部分差三种,在每种情况下均数差值δ分取两个值。总共设计了292个模拟实验,每实验模拟1 000次,共292 000个模拟。整个实验的检验水准都取α=0.05值。利用Monte Carlo法在ET386SX-25计算机上产生样本随机数,并以Ⅰ型误差估计值E、Ⅱ型误差估计值E及某种方法的误差(E+E)为观察指标。
, 百拇医药
    表1 F检验的E估计值(α=0.05) 样本含量

    正态分布

    对数正态分布(CR)

    n1

    n2

    n3

    n4

    方差相等

    0.78

    1.75

    6.19
, 百拇医药
    5

    5

    5

    0.059

    0.059

    0.047

    0.035

    10

    10

    10

    0.048

    0.045

    0.038
, 百拇医药
    0.025

    15

    15

    15

    0.055

    0.053

    0.047

    0.032

    7

    10

    13

    0.052

    0.051
, 百拇医药
    0.045

    0.032

    5

    10

    15

    0.055

    0.052

    0.057

    0.042

    5

    5

    5

    5
, 百拇医药
    0.057

    0.052

    0.047

    0.028

    10

    10

    10

    10

    0.050

    0.047

    0.040

    0.030

    7
, 百拇医药
    10

    13

    16

    0.056

    0.051

    0.045

    0.040

    5

    10

    15

    20

    0.040

    0.040
, http://www.100md.com
    0.040

    0.043

    模拟实验结果

    在模拟实验中,发现RS检验与H检验的模拟结果完全相同,而MR检验只有在例数相等时才有界值表,且模拟结果的E和E值都较其他方法大,故在以下结果中RS法及MR法被删去。

    (一)各方法对分布型的敏感性

    当总体分别为方差相等的正态分布及偏态分布时,以各方法的E估计值与期望值(α=0.05)的吻合情况来说明各检验方法对分布型的敏感性。各种方法的E值列成类似于表1的形式。通过比较得,当CR≠6.19时,F检验对分布的变化不敏感,似对正态性有较好的稳健性,至于非参数检验,无稳健性可言,但从模拟结果可见E值不受分布型的影响。
, 百拇医药
    (二)各方法对方差齐性的敏感性

    当总体为正态分布且方差差值λ为0,1,7时,各方法的E估计值与期望值(α=0.05)的吻合情况列成如表2的形式。通过比较得:八种检验方法都受方差齐性的影响,尤以F检验为最大。当例数不等且与σi顺序时E随λ增大而降低偏于保守;当例数相等及σi与ni倒顺序时,E值随λ增大而增大,尤以后者的E值大大超过期望值α。其中JT检验受λ值影响较小,除σi与ni倒序外,其余的E值都与α较接近。

    表2 F检验的E估计值(α=0.05) 样本含量

    方 差 差 值
, http://www.100md.com
    n1

    n2

    n3

    n4

    0

    1

    7

    5

    5

    5

    0.059

    0.061

, 百拇医药     0.065

    10

    10

    10

    0.048

    0.055

    0.060

    15

    15

    15

    0.051

    0.056

    0.065
, 百拇医药
    5

    5

    5

    5

    0.057

    0.075

    0.084

    10

    10

    10

    10

    0.050

    0.065
, http://www.100md.com
    0.074

    7

    10

    13

    0.052

    0.032

    0.029

    5

    10

    15

    0.055

    0.028

    0.020
, 百拇医药
    7

    10

    13

    16

    0.056

    0.033

    0.037

    5

    10

    15

    20

    0.040

    0.022
, http://www.100md.com
    0.021

    13

    10

    7

    -

    0.081

    0.119

    15

    10

    5

    -

    0.097

    0.163
, 百拇医药
    16

    13

    10

    7

    -

    0.139

    0.174

    20

    15

    10

    5

    -

    0.225

    0.298
, 百拇医药
    表3 各方法的E估计值

    (K=3,正态分布且λ=0,均数全部差)

    样本含量

    方 法

    n1

    n2

    n3

    n4

    ANOV

    H

    RT
, 百拇医药
    JT

    CR1

    CR2

    5

    5

    5

    0.034

    0.050

    0.043

    0.006

    0.067

    0.055

    10
, http://www.100md.com
    10

    10

    0.032

    0.045

    0.040

    0.019

    0.046

    0.044
, 百拇医药
    5

    5

    5

    5

    0.033

    0.063

    0.033

    0.004

    0.065

    0.052
, http://www.100md.com
    5

    10

    15

    20

    0.067

    0.089

    0.080

    0.029

    0.092

    0.087

    表4 各方法对均数差的敏感性

    总体均数

    总 体 分 布
, 百拇医药
    正 态

    偏态

    全部差

    JT,RT,CR2,H,CR1,ANOVA

    JT,RT,CR2,CR1,H,ANOV

    部分差

    ANOVB,RT,H,CR2,CR1,JT

    RT,CR2,H,CR1,JTC,ANOV

    A 在σi或ni相等时,ANOV略次于JT。

    B 当K=4,σi与ni顺向或ni相等时,ANOV位于CR1之后。
, 百拇医药
    C 当K=4,ni相等时,JT优于RT。

    (三)各方法对均数差的敏感性

    这里的敏感性是指在不同的总体及样本含量情况下,以各方法在同一均数差值条件下E值的大小,来说明各方法对均数敏感的程度。各方法的E值列成如表3的形式,按敏感性从强到弱依次排列得表4。

    (四)各方法误差之比较

    上述结果只分别考察了E、E值。若同时考察(E+E)值,则以误差从小到大依次排列得表5。

    表5 各方法的误差之大小 总体均数

    总 体 分 布
, 百拇医药
    正 态 分 布

    偏 态 分 布

    全部差

    JTA,H,CR1,RT,CR2,ANOVB

    JTD,CR1,H,CR2,RT,ANOV

    部分差

    ANOVC,H,CR1,RT,CR2,JT

    CR1,CR2,H,RT,JT,ANOV

    A 当σi与ni顺向时,JT的误差偏大。
, 百拇医药
    B 当σi相等时,ANOV仅次于JT。

    C 当K=4时,ANOV位于最后。

    D 当K=4时,JT介于RT与ANOV之间。讨 论

    (一)以效能强弱选方法

    若以效能最强为首选,次之为备择,则由表4可见所选方法与一般习惯选择有所不同,当均数为全部差时JT为首选,RT为备选,而均数为部分差时RT为首选。但JT是适合于有序备择假设的检验,故在实际工作中我们都首选RT检验,这与教科书及人们常用H检验去分析不符合正态或方差齐性条件的资料不同。

    (二)以误差大小选方法

    判定统计方法好坏的标准应同时结合Ⅰ型误差(α)及Ⅱ型误差值(β)。若Ⅰ型误差相同或相近,则效能越强,方法越好。一般Ⅰ型误差α越大,1-β越高,若Ⅰ型误差值与α接近,说明检验统计的分布越接近实际分布,并非α越小越好。因此,α越接近水准,1-β越大,方法越可取。基于这个标准,当被比较的总体均数有差别时,且无论分布是正态还是偏态,若备择假设是有序时,JT可作为首选,尽管有时其误差值稍大,但从其E值来看,在所有的方法中,JT的E值最接近α,即JT的统计分布与所模拟的分布较接近。若备择假设是无序时,可选H和CR1检验。但当总体模型取方差与样本例数倒序时,所有方法的Ⅰ型误差E值大大超过α,提示我们在实际工作中,这样的资料不可取。比较表4与表5,除RT与H两方法的排列位置不同外,其余方法的位置基本相同。而H与RT两方法相比,若考虑效能强弱,RT法优于H法,若考虑误差大小,H法优于RT法,说明H法比RT法偏于保守。两法的基本思想与公式都基于参数的方差分析,只是所用的界值表不同,H法近似取χ2界值表,而RT法取方差分析F界值表。
, 百拇医药
    (三)F检验的稳健性

    对正态及方差齐性的稳健性,文献〔6〕认为当例数相同时,F检验对非正态性及不等总体方差都稳健,但当例数不等时就不再稳健。文献〔7〕认为非正态性对F检验影响很小,而非独立性或不等总体方差对F检验的影响很大,尤其当例数不等时。本文模拟的结果与文献〔7〕相似。

    参考文献

    1.黄正南.秩转移检验.中国卫生统计,1988,5(2):26

    2.王广仪.多组秩和检验.中国卫生统计,1985,2(1):34

    3.Bell and Doksum.Some New Distribution-Free Statistics.Annals of Mathemetical Statistcs,1965,36:203
, 百拇医药
    4.Wayne.W.Daniel.Applied Nonparametric Statistics.2nd.Ed PWS-KENT:Publishing Company,1990,234

    5.Crouse C.F.Miscellanea:A Non-null Ranking Model For Sequence of Alternatives.Bioetrika,1961,48(3 and 4):441

    6.G.A.F塞伯,方开泰译.线性回归分析.科学出版社,1987,276

    7.Thomas A Bishop and Fdward J.Dudewicz.Exact Analysis of Variance With Unequal Variance:Test Procedure and Tables.Technometrics,1978,20:419, 百拇医药