当前位置: 首页 > 期刊 > 《中华物理医学与康复杂志》 > 1999年第1期
编号:10246913
ANOVA在医学科研中的应用
http://www.100md.com 《中华物理医学与康复杂志》 1999年第1期
     作者:刘勖 张文军 俞立

    单位:050017 河北医科大学

    关键词:

    中华物理医学与康复杂志990120

    ANOVA是英文Analysis of Variance的缩写,常译成变异数分析或方差分析,是经典数理统计学的重要统计分析方法之一,由于有关ANOVA的理论与方法最早是由英国著名统计学家Fisher RA在1928年提出,故又称F检验。

    ANOVA的基本思想是:变异分解。即根据研究推断目的和所采用的科研设计方案把全部观察值之间所表现出来的总变异分解为两个或者更多个组成部分,使每一部分的变异都可用某种因素的作用来解释,然后通过与由于偶然因素而带来的随机误差的相对大小比较,得出各因素对观测结果有无影响的推断性结论。
, http://www.100md.com
    在医学科研中ANOVA常用于以下几个方面:①单因素多水平定量测定结果平均值的差异比较;②多因素多水平组间效应差异和彼此之间交互作用的分析;③自变量与因变量之间回归关系的检验和评断;④二个随机样本的方差齐性检验。其中以单因素多水平平均值差异比较应用最多,下面通过实例对ANOVA在这方面的应用加以介绍。

    1 单因素完全随机设计的ANOVA

    在医学科研中有时要评价实验处理因素在不同水平下所显现出的实验效应有无不同。为此,常采用完全随机设计把观测对象随机分配到几个观测组中去,各组的观测对象数可以相等也可以不等,然后分别给予不同水平的实验处理,观察各组间实验效应(对于计量资料常以平均数表示)有无差异并进而推断这一差异在统计学上有无显著意义。

    例1 某医生用超声多谱勒诊断仪测得30例20~50岁正常人(分3个年龄组)左心功能指标Q-S2〔总电机械收缩时间(s)〕,结果见表1。问能否据此得出:不同年龄段的正常成人Q-S2有差异(即年龄与Q-S2测定结果有关)。
, 百拇医药
    表1 不同年龄段正常人Q-S2

    测定结果(s)及有关中间数据

    20~29岁组

    30~39岁组

    40~45岁组

    0.36

    0.36

    0.39

    0.36

    0.40

    0.36

    0.38
, http://www.100md.com
    0.39

    0.40

    0.37

    0.40

    0.38

    0.35

    0.40

    0.42

    0.36

    0.40

    0.39

    0.41

    0.40
, 百拇医药
    0.40

    0.40

    0.40

    0.39

    0.39

    0.37

    0.40

    0.36

    0.36

    0.38

    ∑Xi

    3.74

    3.88
, http://www.100md.com
    3.91

    11.53(∑X)

    ni

    10

    10

    10

    30(N)i

    0.374

    0.388

    0.391

    0.384(
, http://www.100md.com
    ∑X2i

    1.4024

    1.5082

    1.5311

    4.4417(∑X2)

    1.1 ANOVA分析步骤

    1.1.1 先在表1给出的原始观测数据的基础上求出下列中间数据:各处理组观测值的总和∑Xi、观测值的平方和∑X2i、观测值的例数ni、观测值的平均数i,并在表的右下方求出全部观测值的总和∑X、平方和∑X2、总例数N和总平均值
, 百拇医药
    1.1.2 按式①求出总变异SS,按式②求出总自由度ν………(式①)

    ν=N-1………(式②)

    本例:

    ν=30-1=29

    1.1.3 对总变异进行分解,分解为组间变异SS组间和组内变异SS组内两部分。同时把总自由度ν也相应分解为组间自由度ν组间和组内自由度ν组内。求SS组间、SS组内、ν组间、ν组内的公式分别为: (式③)
, 百拇医药
    SS组内=SS-SS组间 (式④)

    ν组间=K-1 (式⑤)(K为处理组数)

    ν组内=N-K (式⑥)

    本例:

    SS组间

    =0.001 647

    SS组内=0.010 337-0.001 647=0.008 690

    ν组间=3-1=2
, 百拇医药
    ν组内=30-3=27

    1.1.4 列方差分析表求出检验统计量F值

    表2 例1数据方差分析表

    变异

    来源

    SS

    ν

    MS*

    F值**

    组间

    0.001647

    2
, 百拇医药
    0.000824

    2.559

    组内

    0.008690

    27

    0.000322

    总

    0.010337

    29

    注:*MS(均方)=SS/ν * *F=(MS组间)/(MS组内)

    1.1.5 查F界值表(分子自由度ν1为组间自由度,分母自由度ν2为组内自由度)确定P值,作出统计学结论。(由于篇幅所限本文未给出F界值表,请参考有关统计学专著)。
, 百拇医药
    本例求得的F值2.559小于分子自由度为2,分母自由度为27,P=0.05的F界值3.35,故P>0.05,在α=0.05的检验水准上尚不能得出不同年龄正常人Q-S2测定结果有差异的结论(即尚不能认为年龄与Q-S2测定结果有关)。

    2 双因素无重复随机区组设计的ANOVA

    在医学研究中有时还要考虑实验观测结果是否还会受到除实验处理因素以外的另一个混杂因素的干扰,并考核在排除这一混杂因素的影响以后实验处理因素的效应是否仍然显著,为此常采取随机区组设计,对实验处理因素和可疑的混杂因素,实验效应有无统计学意义同时进行考核。

    例2 某脑电图室观察家兔在注射不同剂量的AT3后所造成的脑电图(EEG)波形变化有无差别。同时考虑到不同种系的家兔EEG波形变化可能也有所差异,故采用随机区组设计安排实验以期同时分析AT3剂量和家兔种系对EEG波形变化有无影响。
, 百拇医药
    2.1 ANOVA分析步骤:

    2.1.1 先在表3给出的原始观测数据的

    表3 注射不同剂量AT3的家兔脑电图δ波的变化(%)

    家兔种系

    代号

    处 理 组(AT3剂量)

    ∑Xj

    nj

    小剂量

    中等剂量

    较大剂量
, http://www.100md.com
    大剂量

    A

    29

    37

    27

    38

    131

    4

    区 B

    28

    44

    31

    33

    136
, 百拇医药
    4

    C

    38

    52

    38

    39

    167

    4

    组 D

    29

    35

    36

    34

    134
, 百拇医药
    4

    E

    34

    41

    31

    30

    136

    4

    F

    41

    43

    42

    29

    155
, 百拇医药
    4

    ∑Xi

    199

    252

    205

    203

    859

    (∑X)

    ni

    6

    6

    6

    6
, http://www.100md.com
    24

    (N)i

    33.17

    42.00

    34.17

    33.83

    35.79

    ()

    ∑X2i

    6747
, 百拇医药
    10764

    7155

    6951

    31617

    (∑X2)

    基础上求出下列中间数据:各处理组观测值的总和∑Xi、平方和∑X2i、观测值的例数ni、观测值的平均数i以及各区组观测值的总和∑Xj、观测值的例数nj,并在表的右下方计算出全部观测值的总和∑X、平方和∑X2、总例数N和总平均数
, 百拇医药
    2.1.2 按式①求出总变异SS,按式③求出总自由度ν

    本例:SS=31 617-=871.96

    ν=24-1=23

    2.1.3 对总变异进行分解 分解为处理组间变异SS处理组间、区组间变异SS区组间,随机误差造成的变异SS误差。同时把总自由度ν也相应分解为处理组间自由度ν处理组间、区组间自由度ν区组间和误差自由度ν误差。SS处理组间和ν处理组间可分别按公式③和公式⑤求出。SS区组间、ν区组间、SS误差、ν误差则分别按下式求出。
, http://www.100md.com
    SS区组间=∑ (式⑦)

    ν区组间=b-1 (式⑧)(b为区组数)

    SS误差=SS-SS处理组间-SS区组间 (式⑨)

    ν误差处理组间区组间 (式⑩)

    本例:

    SS处理组间=-=311.46
, 百拇医药
    ν处理组间=4-1=3

    SS区组间=+

    ν区组间=6-1=5

    SS误差=871.96-311.46-260.71=299.79

    ν误差=23-3-5=15

    2.1.4 列方差分析表求出检验统计量F值

    2.1.5 查F界值表确定P值做出统计学结论
, 百拇医药
    表4 例2数据方差分析表

    变异来源

    SS

    ν

    MS

    F值

    处理组间

    311.46

    3

    103.82

    5.19*

    区组间

    260.71
, 百拇医药
    5

    52.14

    2.61**

    误 差

    299.79

    15

    19.99

    总

    871.96

    23

    注:* **
, http://www.100md.com
    处理组间求得的F值5.19大于分子自由度为3、分母自由度为15、P=0.05的F界值3.29,故P<0.05。在α=0.05的检验水准上可得出不同剂量AT3注射后脑电图波形变化不同,即AT3剂量对脑电图波形变化有影响。

    区组间求得的F值2.61小于分子自由度为5、分母自由度为15、P=0.05的F界值2.90,故P>0.05。在α=0.05的检验水准上尚不能得出不同种系家兔脑电图波形变化有差异,即尚不能认为家兔种系对脑电图波形变化有影响。

    以上介绍的只是ANOVA在单因素完全随机设计和双因素无重复随机区组设计在医学科研中的应用。实际上对更复杂的多因多组设计的医学科研数据如拉丁方设计、尧敦方设计、裂区设计、析因设计、正交设计等均可用ANOVA技术进行分析处理。因此,ANOVA的应用范围极其广泛,是处理医学科研数据的强有力的手段,值得所有医学科研工作者认真地学习,充分地开发利用。

    收稿 1999-01-30), 百拇医药