西安市7~18岁学生体格指数主成分与素质指标回归关系的研究
作者:尚 磊 徐勇勇 江逊 陈长生
单位:第四军医大学卫生统计教研室 西安713002
关键词:主成分分析;逐步回归分析;体格指数;素质
数理医药学杂志990215
摘要 采用主成分分析法对反映身体发育的13项指标进行了分析,提取出前四个主成分,结果发现第一主成分反映总体发育状况;第二主成分反映身体发育的充实度;第三主成分在男生中反映身体发育的比例关系,在女生中反映肺功能;第四主成分在男生中反映肺功能,在女生中反映体脂的发育状况。用提取出的四个主成分作变量与三项素质指标做逐步回归分析,所得方程均有意义。
进行学生体质的全面评价时,除已注意到应包括形态、机能及素质三方面的指标外,已从过去的单指标评价发展为综合评价,已往用身高、体重、胸围等基本统计量作评价的甚多,而用一些反映体格发育的派生指标如Kaup指数、Ververck指数等作评价者甚少;评价方法上用单指标的等级法、多指标的相关法、Ridit分析法、秩和比法、模糊评价法较多,而用多元统计方法者较少。本文拟采用主成分分析和逐步回归分析法对中小学生的反映体格发育的状况的指标与素质指标的关系进行初步研究,以便为学生素质的综合评价指标的选择及运动员的选拔提供一定的参考。
, 百拇医药
1 资料来源与分析方法
1.1 资料来源 本文资料取自西安市1995年全国学生体质调研资料,包括7~18岁健康的中小学生2400人(每个年龄组各200人),其中城乡及男女比例均为1∶1。
1.2 指标选择 体格指标:①基本指标:身高、体重、胸围、肺活量、坐高;②派生指标:Quetelet指数、Kaup指数、Ververck指数、%BF体脂比、身高胸围指数、体重肺活量指数、身高坐高指数。素质指标:50米跑速度、立定跳远距离、引体向上次数(男)或抑卧起坐次数(女)。
1.3 分析方法 首先采用主成分分析法分别提取城男、城女、乡男、乡女的13项反映身体发育状况指标的主成分,然后用提取的主成分作待选自变量分别与三项素质指标进行逐步回归分析,全部分析采用SPLM软件处理。
2 分析结果
, 百拇医药
2.1 主成分分析的结果
无论城乡还是男女提取前4个主成分就已经能很好地表达原指标所提供的信息,累积贡献率在95%以上,表1给出了各组1~4主成分因子负荷及贡献率。
主成分分析结果表明,无论城乡还是男女第一主成分除个别指标因子负荷较小外,大部分指标的因子负荷大小相近,说明反映身体发育的各指标具有同等重要性,因此可认为第一主成分是反映身体总体发育情况的综合指标。无论城乡还是男女第二主成分的因子负荷以Rother指数、Kaup指数的因子负荷最大,该指标反映人体充实度,因此第二主成分可看作是反映人体充实度的指标。第三主成分在女生中以肺活量/体重的因子负荷最大,因此女生的第三主成分主要反映肺功能;在男生中以坐高/身高、胸围/身高的因子负荷最大,因此男生的第三主成分主要反映人体比例协调度。第四主成分在女生中以体脂比的因子负荷最大,因此女生的第四主成分主要反映体脂肪的发育情况;在男生组中以肺活量/体重的因子负荷最大,因此男性的第四主成分主要反映肺功能。
, http://www.100md.com
2.2 对三项素质指标的逐步回归分析结果
城乡男女均以提取出的主成分为待选自变量分别与三项素质指标进行逐步回归分析,门坎值选为1,结果如表2所示。
根据方差分析结果,各回归方程在统计学上均有显著意义,且决定系数R2的数值0.45以上,说明各组在50米跑、立定跳远、引体向上或仰卧起坐次数上的差异大部分可用所选入的主成分的回归关系解释,这就为从城乡学生中选拔体育专门人才,根据学生的体型特点选择体育教学方案,提供了参考依据。例如,对男学生,50米跑速度的回归方程中,第一主成分是负向影响,第三、四主成分是正向影响,由于50米跑成绩是所需时间越短越好,故有意识的选拔总体发育好、腿长、比例协调、肺活量大的学生,可望创造50米跑的好成绩。同样,对于立定跳远,由于第一、三主成分是正向影响,而且立定跳远是跳的越远越好,故应选拔总体发育好、腿长、比例协调的学生加以培养;在引体向上回归方程中第一、四主成分为正向影响,因此应选择总体发育好、肺活量大者可望取得好成绩。
, 百拇医药
对于女生,50米跳速度的回归方程中,第一主成分是负向影响,第三、四主成分是正向影响,由于50米跑成绩是所需时间越短越好,故有意识的选拔总体育好、腿长、体型匀称、肺活量大的学生,可望创造50米跑的好成绩。立定跳远的第一、三主成分是正向影响,第四主成分是负向影响,而且立定跳远是跳的越远越好,故应选拔总体发育好、体脂小、肺活量大者加以培养;仰卧起坐,第一、三主成分是正向影响,仰卧起坐是次数越多越好,故应选拔总体发育好、肺活量的学生为好。
表1 各组1~4主成分各变量的因子负荷及贡献率 分组
变 量
PC1
PC2
PC3
PC4
, 百拇医药
分组
变 量
PC1
PC2
PC3
PC4
城男
肺活量
-0.2828
0.1189
0.2062
-0.5032
乡男
, http://www.100md.com
肺活量
-0.3390
0.1053
0.2120
-0.5476
身高
-0.2825
0.3327
-0.1433
-0.1635
身高
-0.3425
0.1786
, http://www.100md.com
-0.0955
0.0632
体重
-0.3493
0.3068
-0.0577
-0.1042
体重
-0.3595
-0.2721
-0.0488
0.0721
, http://www.100md.com 胸围
-0.3537
0.0797
-0.0243
-0.0073
胸围
-0.3563
-0.0270
0.0068
0.0109
坐高
-0.2911
-0.1049
, http://www.100md.com
0.0164
-0.2726
坐高
-0.3433
0.1337
0.0103
0.1640
Quetelet指数
-0.3579
-0.3373
-0.0440
-0.0678
, 百拇医药
Quetelet指数
-0.3579
-0.2568
-0.0545
0.0608
胸围/身高
-0.2580
0.0296
0.4895
0.2212
胸围/身高
-0.1200
, 百拇医药
-0.0610
0.5377
-0.1627
Rother指数
-0.1803
-0.4715
0.1307
0.1231
Rother指数
0.1095
-0.5968
0.0930
, 百拇医药
-0.0185
Kaup指数
-0.3424
0.3691
0.0079
0.0035
Kaup指数
-0.3243
0.4960
-0.0340
0.0401
肺活量/体重
, 百拇医药
0.0363
-0.1629
0.1582
0.6574
肺活量/体重
-0.0771
-0.0610
0.2458
-0.6357
Ververck指数
-0.3531
0.3064
, 百拇医药
0.0276
0.0341
Ververck指数
-0.3579
0.2300
-0.0545
0.0608
%BF
-0.1946
-0.3729
-0.1780
0.2915
, http://www.100md.com
%BF
-0.0078
-0.3685
-0.4283
0.4579
坐高/身高
0.0032
-0.1763
0.7852
0.2186
坐高/身高
0.0007
, 百拇医药 0.0092
0.6282
-0.1195
方差
7.6817
3.0507
1.1619
0.6723
方差
7.6430
2.5237
1.2397
0.7950
, 百拇医药
贡献率
59.09
23.47
8.94
5.17
贡献率
59.79
20.41
9.54
6.12
累计贡献率
59.09
82.56
, 百拇医药
91.49
96.67
累计贡献率
59.79
80.21
89.74
95.86
城女
肺活量
-0.2649
0.1334
-0.2897
-0.0822
, 百拇医药
乡女
肺活量
-0.2826
-0.1128
0.5365
-0.2273
身高
-0.2662
0.3900
0.2503
0.1059
身高
-0.2895
, 百拇医药
-0.3619
0.1637
0.1042
体重
-0.3344
0.3774
0.0978
0.0621
体重
-0.3329
-0.3176
0.0508
, 百拇医药 0.0550
胸围
-0.3361
0.0849
0.0017
0.0563
胸围
-0.3312
-0.0827
-0.0095
0.0349
坐高
-0.2738
, 百拇医药
0.0412
0.3147
-0.2372
坐高
-0.2931
0.3368
0.3251
-0.5614
Quetelet指数
-0.3420
0.3181
0.0447
, 百拇医药
0.0489
Quetelet指数
-0.2716
-0.0337
0.0128
0.0407
胸围/身高
-0.2754
-0.0954
-0.2840
-0.0264
胸围/身高
, 百拇医药
-0.2516
0.3836
-0.2733
-0.0861
Rother指数
-0.2309
-0.4548
-0.2541
-0.0609
Rother指数
-0.2180
-0.5614
, 百拇医药
-0.2409
-0.0822
Kaup指数
-0.3335
0.4169
-0.0628
0.0151
Kaup指数
-0.3286
0.5195
-0.0692
0.0056
, http://www.100md.com
肺活量/体重
0.0989
-0.1413
-0.7364
-0.2498
肺活量/体重
-0.0228
-0.0337
-0.6056
-0.1390
Ververck指数
-0.3390
, 百拇医药
-0.3036
-0.0852
0.0219
Ververck指数
-0.3368
-0.3472
0.0128
0.0407
%BF
-0.2743
-0.2260
-0.0702
, http://www.100md.com
0.9165
%BF
-0.2674
0.2298
0.1417
-0.7613
坐高/身高
-0.0431
-0.1571
0.1980
0.0940
坐高/身高
, http://www.100md.com 0.1103
0.2491
-0.2413
-0.1191
方差
8.3939
2.2182
1.0660
0.8459
方差
8.7176
1.7543
1.0687
, http://www.100md.com
0.9264
贡献率
64.57
17.06
8.20
6.51
贡献率
67.06
13.49
8.22
7.13
累计贡献率
64.57
, http://www.100md.com
81.63
89.83
96.34
累计贡献率
67.06
80.55
88.77
95.00
表2 1~4主成分与素质指标逐步回归分析结果 分组
素质指标
回归方程
R2
, http://www.100md.com
F
P
城男
50米跑速度
Y=4.404Z3-4.423Z1+99.805
0.793
17.235
0.001
立定跳远距离
Y=14.36Z1+14.32Z3+149.39
0.855
26.42
, 百拇医药
0.000
引体向上次数
Y=2.797Z1+2.813Z4+21.247
0.53
91.766
0.000
城女
50米跑速度
Y=9.588Z3+6.312Z4-15.898Z1+95.676
0.752
8.102
0.008
, 百拇医药
立定跳远距离
Y=42.502Z1+29.126Z3-13.378Z4+162.13
0.825
12.584
0.002
仰卧起坐次数
Y=5.56Z1+5.564Z3+28.899
0.485
5.241
0.040
乡男
50米跑速度
, http://www.100md.com
Y=19.636Z4-34.33Z1+14.695Z3+85.933
0.893
22.345
0.000
立定跳远距离
Y=88.853Z1-51.048Z4+37.788Z3+181.97
0.879
19.321
0.001
引体向上次数
Y=13.176Z1+7.24Z4+28.42
, http://www.100md.com
0.65
73.582
0.000
乡女
50米跑速度
Y=3.427Z3-6.315Z1+9.733Z4+107.089
0.803
10.868
0.003
立定跳远距离
Y=18.98Z1+18.95Z3+128.33
0.883
, http://www.100md.com
33.966
0.000
仰卧起坐次数
Y=5.94Z1+5.937Z3+24.95
0.737
12.595
0.003
3 讨论
主成分分析可将众多的彼此相关的原始指标综合成数目较少,彼此无关的新指标主成分,逐步回归是一种从引入和剔除两个方向上反复进行筛选变量,以建立最优方程的方法,两种方法都可在一定程度上减少多元共线性的影响。因此,将二者结合起来可将多元共线控制在最低限度,取得较为满意的回归效果,从而为发现和选拔体育专门人才,选拔身体素质好的青年入伍提供一定参考,并能为体育教学改革及学生素质的评价指标的筛选提供一定的线索。
参考文献
1 黄正南.医用多因素分析.第三版.湖南:湖南科学技术出版社,1995,193~224.
2 唐锡麟主编.儿童少年卫生学.第二版.北京:人民卫生出版社,1987.
3 郭祖超主编.医用数理统计方法.第三版.北京:人民卫生出版社,1988.
收稿日期:1998-12-06, 百拇医药
单位:第四军医大学卫生统计教研室 西安713002
关键词:主成分分析;逐步回归分析;体格指数;素质
数理医药学杂志990215
摘要 采用主成分分析法对反映身体发育的13项指标进行了分析,提取出前四个主成分,结果发现第一主成分反映总体发育状况;第二主成分反映身体发育的充实度;第三主成分在男生中反映身体发育的比例关系,在女生中反映肺功能;第四主成分在男生中反映肺功能,在女生中反映体脂的发育状况。用提取出的四个主成分作变量与三项素质指标做逐步回归分析,所得方程均有意义。
进行学生体质的全面评价时,除已注意到应包括形态、机能及素质三方面的指标外,已从过去的单指标评价发展为综合评价,已往用身高、体重、胸围等基本统计量作评价的甚多,而用一些反映体格发育的派生指标如Kaup指数、Ververck指数等作评价者甚少;评价方法上用单指标的等级法、多指标的相关法、Ridit分析法、秩和比法、模糊评价法较多,而用多元统计方法者较少。本文拟采用主成分分析和逐步回归分析法对中小学生的反映体格发育的状况的指标与素质指标的关系进行初步研究,以便为学生素质的综合评价指标的选择及运动员的选拔提供一定的参考。
, 百拇医药
1 资料来源与分析方法
1.1 资料来源 本文资料取自西安市1995年全国学生体质调研资料,包括7~18岁健康的中小学生2400人(每个年龄组各200人),其中城乡及男女比例均为1∶1。
1.2 指标选择 体格指标:①基本指标:身高、体重、胸围、肺活量、坐高;②派生指标:Quetelet指数、Kaup指数、Ververck指数、%BF体脂比、身高胸围指数、体重肺活量指数、身高坐高指数。素质指标:50米跑速度、立定跳远距离、引体向上次数(男)或抑卧起坐次数(女)。
1.3 分析方法 首先采用主成分分析法分别提取城男、城女、乡男、乡女的13项反映身体发育状况指标的主成分,然后用提取的主成分作待选自变量分别与三项素质指标进行逐步回归分析,全部分析采用SPLM软件处理。
2 分析结果
, 百拇医药
2.1 主成分分析的结果
无论城乡还是男女提取前4个主成分就已经能很好地表达原指标所提供的信息,累积贡献率在95%以上,表1给出了各组1~4主成分因子负荷及贡献率。
主成分分析结果表明,无论城乡还是男女第一主成分除个别指标因子负荷较小外,大部分指标的因子负荷大小相近,说明反映身体发育的各指标具有同等重要性,因此可认为第一主成分是反映身体总体发育情况的综合指标。无论城乡还是男女第二主成分的因子负荷以Rother指数、Kaup指数的因子负荷最大,该指标反映人体充实度,因此第二主成分可看作是反映人体充实度的指标。第三主成分在女生中以肺活量/体重的因子负荷最大,因此女生的第三主成分主要反映肺功能;在男生中以坐高/身高、胸围/身高的因子负荷最大,因此男生的第三主成分主要反映人体比例协调度。第四主成分在女生中以体脂比的因子负荷最大,因此女生的第四主成分主要反映体脂肪的发育情况;在男生组中以肺活量/体重的因子负荷最大,因此男性的第四主成分主要反映肺功能。
, http://www.100md.com
2.2 对三项素质指标的逐步回归分析结果
城乡男女均以提取出的主成分为待选自变量分别与三项素质指标进行逐步回归分析,门坎值选为1,结果如表2所示。
根据方差分析结果,各回归方程在统计学上均有显著意义,且决定系数R2的数值0.45以上,说明各组在50米跑、立定跳远、引体向上或仰卧起坐次数上的差异大部分可用所选入的主成分的回归关系解释,这就为从城乡学生中选拔体育专门人才,根据学生的体型特点选择体育教学方案,提供了参考依据。例如,对男学生,50米跑速度的回归方程中,第一主成分是负向影响,第三、四主成分是正向影响,由于50米跑成绩是所需时间越短越好,故有意识的选拔总体发育好、腿长、比例协调、肺活量大的学生,可望创造50米跑的好成绩。同样,对于立定跳远,由于第一、三主成分是正向影响,而且立定跳远是跳的越远越好,故应选拔总体发育好、腿长、比例协调的学生加以培养;在引体向上回归方程中第一、四主成分为正向影响,因此应选择总体发育好、肺活量大者可望取得好成绩。
, 百拇医药
对于女生,50米跳速度的回归方程中,第一主成分是负向影响,第三、四主成分是正向影响,由于50米跑成绩是所需时间越短越好,故有意识的选拔总体育好、腿长、体型匀称、肺活量大的学生,可望创造50米跑的好成绩。立定跳远的第一、三主成分是正向影响,第四主成分是负向影响,而且立定跳远是跳的越远越好,故应选拔总体发育好、体脂小、肺活量大者加以培养;仰卧起坐,第一、三主成分是正向影响,仰卧起坐是次数越多越好,故应选拔总体发育好、肺活量的学生为好。
表1 各组1~4主成分各变量的因子负荷及贡献率 分组
变 量
PC1
PC2
PC3
PC4
, 百拇医药
分组
变 量
PC1
PC2
PC3
PC4
城男
肺活量
-0.2828
0.1189
0.2062
-0.5032
乡男
, http://www.100md.com
肺活量
-0.3390
0.1053
0.2120
-0.5476
身高
-0.2825
0.3327
-0.1433
-0.1635
身高
-0.3425
0.1786
, http://www.100md.com
-0.0955
0.0632
体重
-0.3493
0.3068
-0.0577
-0.1042
体重
-0.3595
-0.2721
-0.0488
0.0721
, http://www.100md.com 胸围
-0.3537
0.0797
-0.0243
-0.0073
胸围
-0.3563
-0.0270
0.0068
0.0109
坐高
-0.2911
-0.1049
, http://www.100md.com
0.0164
-0.2726
坐高
-0.3433
0.1337
0.0103
0.1640
Quetelet指数
-0.3579
-0.3373
-0.0440
-0.0678
, 百拇医药
Quetelet指数
-0.3579
-0.2568
-0.0545
0.0608
胸围/身高
-0.2580
0.0296
0.4895
0.2212
胸围/身高
-0.1200
, 百拇医药
-0.0610
0.5377
-0.1627
Rother指数
-0.1803
-0.4715
0.1307
0.1231
Rother指数
0.1095
-0.5968
0.0930
, 百拇医药
-0.0185
Kaup指数
-0.3424
0.3691
0.0079
0.0035
Kaup指数
-0.3243
0.4960
-0.0340
0.0401
肺活量/体重
, 百拇医药
0.0363
-0.1629
0.1582
0.6574
肺活量/体重
-0.0771
-0.0610
0.2458
-0.6357
Ververck指数
-0.3531
0.3064
, 百拇医药
0.0276
0.0341
Ververck指数
-0.3579
0.2300
-0.0545
0.0608
%BF
-0.1946
-0.3729
-0.1780
0.2915
, http://www.100md.com
%BF
-0.0078
-0.3685
-0.4283
0.4579
坐高/身高
0.0032
-0.1763
0.7852
0.2186
坐高/身高
0.0007
, 百拇医药 0.0092
0.6282
-0.1195
方差
7.6817
3.0507
1.1619
0.6723
方差
7.6430
2.5237
1.2397
0.7950
, 百拇医药
贡献率
59.09
23.47
8.94
5.17
贡献率
59.79
20.41
9.54
6.12
累计贡献率
59.09
82.56
, 百拇医药
91.49
96.67
累计贡献率
59.79
80.21
89.74
95.86
城女
肺活量
-0.2649
0.1334
-0.2897
-0.0822
, 百拇医药
乡女
肺活量
-0.2826
-0.1128
0.5365
-0.2273
身高
-0.2662
0.3900
0.2503
0.1059
身高
-0.2895
, 百拇医药
-0.3619
0.1637
0.1042
体重
-0.3344
0.3774
0.0978
0.0621
体重
-0.3329
-0.3176
0.0508
, 百拇医药 0.0550
胸围
-0.3361
0.0849
0.0017
0.0563
胸围
-0.3312
-0.0827
-0.0095
0.0349
坐高
-0.2738
, 百拇医药
0.0412
0.3147
-0.2372
坐高
-0.2931
0.3368
0.3251
-0.5614
Quetelet指数
-0.3420
0.3181
0.0447
, 百拇医药
0.0489
Quetelet指数
-0.2716
-0.0337
0.0128
0.0407
胸围/身高
-0.2754
-0.0954
-0.2840
-0.0264
胸围/身高
, 百拇医药
-0.2516
0.3836
-0.2733
-0.0861
Rother指数
-0.2309
-0.4548
-0.2541
-0.0609
Rother指数
-0.2180
-0.5614
, 百拇医药
-0.2409
-0.0822
Kaup指数
-0.3335
0.4169
-0.0628
0.0151
Kaup指数
-0.3286
0.5195
-0.0692
0.0056
, http://www.100md.com
肺活量/体重
0.0989
-0.1413
-0.7364
-0.2498
肺活量/体重
-0.0228
-0.0337
-0.6056
-0.1390
Ververck指数
-0.3390
, 百拇医药
-0.3036
-0.0852
0.0219
Ververck指数
-0.3368
-0.3472
0.0128
0.0407
%BF
-0.2743
-0.2260
-0.0702
, http://www.100md.com
0.9165
%BF
-0.2674
0.2298
0.1417
-0.7613
坐高/身高
-0.0431
-0.1571
0.1980
0.0940
坐高/身高
, http://www.100md.com 0.1103
0.2491
-0.2413
-0.1191
方差
8.3939
2.2182
1.0660
0.8459
方差
8.7176
1.7543
1.0687
, http://www.100md.com
0.9264
贡献率
64.57
17.06
8.20
6.51
贡献率
67.06
13.49
8.22
7.13
累计贡献率
64.57
, http://www.100md.com
81.63
89.83
96.34
累计贡献率
67.06
80.55
88.77
95.00
表2 1~4主成分与素质指标逐步回归分析结果 分组
素质指标
回归方程
R2
, http://www.100md.com
F
P
城男
50米跑速度
Y=4.404Z3-4.423Z1+99.805
0.793
17.235
0.001
立定跳远距离
Y=14.36Z1+14.32Z3+149.39
0.855
26.42
, 百拇医药
0.000
引体向上次数
Y=2.797Z1+2.813Z4+21.247
0.53
91.766
0.000
城女
50米跑速度
Y=9.588Z3+6.312Z4-15.898Z1+95.676
0.752
8.102
0.008
, 百拇医药
立定跳远距离
Y=42.502Z1+29.126Z3-13.378Z4+162.13
0.825
12.584
0.002
仰卧起坐次数
Y=5.56Z1+5.564Z3+28.899
0.485
5.241
0.040
乡男
50米跑速度
, http://www.100md.com
Y=19.636Z4-34.33Z1+14.695Z3+85.933
0.893
22.345
0.000
立定跳远距离
Y=88.853Z1-51.048Z4+37.788Z3+181.97
0.879
19.321
0.001
引体向上次数
Y=13.176Z1+7.24Z4+28.42
, http://www.100md.com
0.65
73.582
0.000
乡女
50米跑速度
Y=3.427Z3-6.315Z1+9.733Z4+107.089
0.803
10.868
0.003
立定跳远距离
Y=18.98Z1+18.95Z3+128.33
0.883
, http://www.100md.com
33.966
0.000
仰卧起坐次数
Y=5.94Z1+5.937Z3+24.95
0.737
12.595
0.003
3 讨论
主成分分析可将众多的彼此相关的原始指标综合成数目较少,彼此无关的新指标主成分,逐步回归是一种从引入和剔除两个方向上反复进行筛选变量,以建立最优方程的方法,两种方法都可在一定程度上减少多元共线性的影响。因此,将二者结合起来可将多元共线控制在最低限度,取得较为满意的回归效果,从而为发现和选拔体育专门人才,选拔身体素质好的青年入伍提供一定参考,并能为体育教学改革及学生素质的评价指标的筛选提供一定的线索。
参考文献
1 黄正南.医用多因素分析.第三版.湖南:湖南科学技术出版社,1995,193~224.
2 唐锡麟主编.儿童少年卫生学.第二版.北京:人民卫生出版社,1987.
3 郭祖超主编.医用数理统计方法.第三版.北京:人民卫生出版社,1988.
收稿日期:1998-12-06, 百拇医药