用百分位数回归制订正常人群血压参考值的研究
作者:季 莘 陈 峰 吴先萍
单位:南通医学院卫生系 南通226001
关键词:百分位数回归;直线回归;血压;参考值范围
数理医药学杂志990409
摘 要 用百分位数回归的方法,对5000例正常人血压调查结果进行分析,提出不同年龄血压参考值范围,并与传统的直线回归方法比较。
人体的血压受年龄、性别、生理及心理等诸多因素的影响,而年龄是非常重要的因素。已有研究表明,随着年龄的增长,收缩压与舒张压均有逐渐增高的趋势,而收缩压增高更为显著[1]。因此,制定不同年龄段血压的参考值范围,无疑能对临床医生早期诊断、治疗高血压疾病提供科学依据。目前制订的血压参考值存在下面几个问题:(1)所分的年龄段跨度大,各年龄段间数据不连续,是跳跃的;(2)未考虑血压在不同年龄时的变异情况;(3)用均数±标准差制订参考值范围不符合数据的实际分布。制订血压参考值的关键是统计方法的选择,传统的直线回归(LS)介绍用最小二乘法的原理进行区间估计,但由于人体各年龄段的血压变异情况不同,用这种方法拟合的回归方程稳定性差,易导致误判。本文选用一种适合这种资料的新的统计方法百分位数回归(LA),现报导如下。
, http://www.100md.com
1 资料和方法
1.1 资料
1991年四川省高血压抽样调查5000例10~80岁正常人血压值,其中男性2541例,女性2456例,每人收缩压和舒张压分别测三次,取其平均值。
1.2 方法
根据资料的性质,本文用百分位数回归进行统计分析。百分位数即由自变量x估计因变量y的百分位数。百分位回归模型为:Q=aQ+bQx
这里yQ表示给定x的条件下,y的Q分位数的估计值。0, 百拇医药
∑|iQ-aQ-bQxi|hiQ
达到最小。
这里
参数的区间估计近似用t分布原理方法。
2 结果
2.1 本文调查的5000例10~80岁正常人收缩压均值男性为15.67KPa,女性为15.12Kpa;舒张压男性为9.7KPa,女性为9.34KPa。
男、女收缩压和舒张压均与年龄呈正相关关系,即随着年龄的增加,收缩压和舒张压均明显增加,而收缩压增加更为显著。其均数、相关系数见表1。
, 百拇医药
表1 男、女血压平均值、血压与年龄的相关系数
平均值(KPa)
相关系数
P
收缩压
男(2541例)
女(2456例)
15.67
15.12
0.3403
0.4419
<0.05
, 百拇医药
<0.05
舒张压
男(2541例)
女(2456例)
9.76
9.34
0.2573
0.3063
<0.05
<0.05
2.2 由年龄推算血压的分位数回归方程为:
80%分位数回归方程: 收缩压
, 百拇医药
男 0.8=14.275+0.067x
女 0.8=12.409+0.098x
舒张压
男 0.8=9.346+0.034x
女 0.8=8.569+0.042x
50%分位数回归方程:
, 百拇医药
收缩压
男0.5=13.816+0.037x
女0.5=12.454+0.055x
舒张压
男0.5=8.753+0.021x
女0.5=8.106+0.026x
, http://www.100md.com
由80%分位数回归方程和50%分位数回归方程得到各年龄段血压参考值范围和各年龄段血压平均值,并与本次调查的实际结果进行了比较,见表2。
2.3 5000例正常男、女收缩压与年龄的回归图见图1,图2(图中实线表示50%分位数回归线和80%分位数回归线上限,虚线表示LS回归线和80%容许区间上限)。由实线部分可见,其分布均呈扇形,表示随着年龄的增加,收缩压随之增加,分布随之变宽,也就是变异随之增加。其变异系数见表2。
表2 各年龄段血压平均值、中位数(M)、参考值上限(上限)、变异系数(CV%) 收缩压(KPa)
舒张压(KPa)
年龄
男
, http://www.100md.com
女
男
女
M
上限
CV
M
上限
CV
M
, 百拇医药
上限
CV
M
上限
CV
10~
14.15
14.27
15.10
11.8
14.23
13.14
, http://www.100md.com
13.63
10.3
8.53
9.02
9.76
15.6
8.75
8.43
9.10
12.7
15~
14.83
14.46
, 百拇医药
15.44
11.4
14.34
13.40
14.12
9.7
8.98
9.12
9.94
12.4
8.98
8.55
9.30
, 百拇医药
12.0
20~
15.30
14.64
15.77
10.2
14.23
13.69
14.62
9.4
9.38
9.23
10.09
, 百拇医药
12.1
8.79
8.68
9.51
11.8
25~
15.23
14.82
16.11
9.9
14.12
13.95
15.10
, 百拇医药
8.9
9.46
9.34
10.27
12.1
8.79
8.82
9.72
12.0
30~
15.18
15.00
16.44
, 百拇医药
9.7
14.19
14.23
15.60
10.1
9.64
9.44
10.44
11.7
9.02
8.95
9.92
12.2
, 百拇医药
35~
15.12
15.19
16.76
10.7
14.70
14.50
16.09
11.0
9.83
9.55
10.60
12.7
, 百拇医药
9.42
9.07
10.13
12.3
40~
15.41
15.37
17.10
11.3
15.32
14.78
17.06
14.8
, 百拇医药
10.05
9.66
10.76
13.6
9.76
9.20
10.35
14.4
45~
15.61
15.55
17.44
13.2
, http://www.100md.com
15.39
15.04
17.75
15.1
10.23
9.76
10.93
13.9
9.78
9.34
10.55
13.2
50~
, 百拇医药
15.79
15.73
17.76
14.2
16.09
15.32
18.06
20.0
10.25
9.87
11.11
13.7
9.88
, 百拇医药
9.48
10.76
16.7
55~
16.98
15.92
18.10
17.8
16.85
15.59
18.55
20.0
10.35
, 百拇医药
9.98
11.28
15.3
9.95
9.66
10.97
15.4
60~
16.98
16.09
18.43
18.8
17.56
, 百拇医药
15.87
19.05
19.7
10.25
10.08
11.44
17.1
10.04
9.72
11.19
17.0
65~
17.84
, 百拇医药
16.28
18.77
17.8
17.92
16.13
19.54
22.6
9.98
10.19
11.61
17.7
9.86
9.84
, 百拇医药
11.38
17.9
70~80
18.07
17.21
19.26
25.5
19.02
16.53
19.78
24.0
9.78
10.35
, http://www.100md.com
11.85
20.4
9.79
10.04
11.70
19.0
图1 男性收缩压与年龄的LS回归与LA回归 图2 女性收缩压与年龄的LS回归与LA回归
3 讨论
3.1 年龄是影响血压值高低的一个重要的混杂因素,它们之间呈明显的正相关关系。本文研究结果与之吻合。目前血压参考值定为39岁以下收缩压上限为18.62Kpa,随后每增加10岁,收缩压相应增加1.33KPa。也有生理学书籍介绍[1],青年时收缩压、舒张压的正常值为15.96KPa/10.64KPa以下;50岁以前为18.62KPa/11.97KPa以下;50岁以后为21.28KPa/12.64KPa以下。笔者认为,制订血压参考值应考虑以下几个问题:(1)年龄跨度不宜太大,要保下数据的连续性,应用时能按实际年龄判断。(2)要考虑年龄增加时,血压值的变异也随之增加,血压值并非阶梯式递增。(3)所选择的统计方法应能正确描述数据的分布。由表2及图1、图2中实线部分可见,在低年龄段时,由于变异系数较小,参考值上限与该年龄段的平均值接近,即参考值范围较窄;而在高年龄段时,变异系数增大,参考值上限与该年龄段平均值的差值也增加,即参考值范围也增宽,这一结论与临床实际情况相符。
, http://www.100md.com
3.2 传统的直线回归中用最小二乘法的原理得到回归方程,它要求数据独立,方差齐性及因变量正态分布。而人体的血压值分布呈偏态,且方差不齐。由图1、图2中虚线部分可见,按最小二乘法得到的各年龄段参考值上限与所在年龄段均数的距离均相等,也就是参考值上限与回归直线平均,它没有反映出各年龄段的变异情况,与实际情况相悖。本文选用的百分位数回归法采用加权最小一乘法估计回归系数,该法适用于因变量的分布不是正态或方差不为常数的资料,能有效地估计给定自变量x时,因变量y的中位数、百分位数及参考值范围等。据stuart和ord介绍[2],这种方法早在1757年就提出了,但由于计算复杂,并未得到普遍应用,近代统计学研究发现最小二乘回归有时并不理想,特别当数值变异较大时,所拟合的直线就会产生偏离致稳定性差。随着计算机应用的迅猛发展,百分位数回归方法又逐渐被重视,现在许多统计软件如SYSTATA等均提供了中位数回归或百分位数回归的算法。
3.3 有研究者调查上海112419例人体血压值得到各年龄段的血压平均值[3],其工作量之大、费用之高可想而知。我们仅用5000例血压调查值得到各年龄段参考值范围及平均值,并与临床实际情况相符。百分位数回归不仅适用于人体血压和年龄关系的研究,对其它具有同样性质的资料也适用。
参考文献
1 何瑞荣主编.心血管生理学.人民卫生出版社,1987,129.
2 Stuart A and ord JK.kendall’s Advanced Theory of Statistics. Vol2(5). New York: oxford university Press. 1991.
3 杨树勤主编.中国医学百科全书.医学统计学.上海科学技术出版社,1985,145~152.
收稿日期:1998-12-16, 百拇医药
单位:南通医学院卫生系 南通226001
关键词:百分位数回归;直线回归;血压;参考值范围
数理医药学杂志990409
摘 要 用百分位数回归的方法,对5000例正常人血压调查结果进行分析,提出不同年龄血压参考值范围,并与传统的直线回归方法比较。
人体的血压受年龄、性别、生理及心理等诸多因素的影响,而年龄是非常重要的因素。已有研究表明,随着年龄的增长,收缩压与舒张压均有逐渐增高的趋势,而收缩压增高更为显著[1]。因此,制定不同年龄段血压的参考值范围,无疑能对临床医生早期诊断、治疗高血压疾病提供科学依据。目前制订的血压参考值存在下面几个问题:(1)所分的年龄段跨度大,各年龄段间数据不连续,是跳跃的;(2)未考虑血压在不同年龄时的变异情况;(3)用均数±标准差制订参考值范围不符合数据的实际分布。制订血压参考值的关键是统计方法的选择,传统的直线回归(LS)介绍用最小二乘法的原理进行区间估计,但由于人体各年龄段的血压变异情况不同,用这种方法拟合的回归方程稳定性差,易导致误判。本文选用一种适合这种资料的新的统计方法百分位数回归(LA),现报导如下。
, http://www.100md.com
1 资料和方法
1.1 资料
1991年四川省高血压抽样调查5000例10~80岁正常人血压值,其中男性2541例,女性2456例,每人收缩压和舒张压分别测三次,取其平均值。
1.2 方法
根据资料的性质,本文用百分位数回归进行统计分析。百分位数即由自变量x估计因变量y的百分位数。百分位回归模型为:Q=aQ+bQx
这里yQ表示给定x的条件下,y的Q分位数的估计值。0, 百拇医药
∑|iQ-aQ-bQxi|hiQ
达到最小。
这里
参数的区间估计近似用t分布原理方法。
2 结果
2.1 本文调查的5000例10~80岁正常人收缩压均值男性为15.67KPa,女性为15.12Kpa;舒张压男性为9.7KPa,女性为9.34KPa。
男、女收缩压和舒张压均与年龄呈正相关关系,即随着年龄的增加,收缩压和舒张压均明显增加,而收缩压增加更为显著。其均数、相关系数见表1。
, 百拇医药
表1 男、女血压平均值、血压与年龄的相关系数
平均值(KPa)
相关系数
P
收缩压
男(2541例)
女(2456例)
15.67
15.12
0.3403
0.4419
<0.05
, 百拇医药
<0.05
舒张压
男(2541例)
女(2456例)
9.76
9.34
0.2573
0.3063
<0.05
<0.05
2.2 由年龄推算血压的分位数回归方程为:
80%分位数回归方程: 收缩压
, 百拇医药
男 0.8=14.275+0.067x
女 0.8=12.409+0.098x
舒张压
男 0.8=9.346+0.034x
女 0.8=8.569+0.042x
50%分位数回归方程:
, 百拇医药
收缩压
男0.5=13.816+0.037x
女0.5=12.454+0.055x
舒张压
男0.5=8.753+0.021x
女0.5=8.106+0.026x
, http://www.100md.com
由80%分位数回归方程和50%分位数回归方程得到各年龄段血压参考值范围和各年龄段血压平均值,并与本次调查的实际结果进行了比较,见表2。
2.3 5000例正常男、女收缩压与年龄的回归图见图1,图2(图中实线表示50%分位数回归线和80%分位数回归线上限,虚线表示LS回归线和80%容许区间上限)。由实线部分可见,其分布均呈扇形,表示随着年龄的增加,收缩压随之增加,分布随之变宽,也就是变异随之增加。其变异系数见表2。
表2 各年龄段血压平均值、中位数(M)、参考值上限(上限)、变异系数(CV%) 收缩压(KPa)
舒张压(KPa)
年龄
男
, http://www.100md.com
女
男
女
M
上限
CV
M
上限
CV
M
, 百拇医药
上限
CV
M
上限
CV
10~
14.15
14.27
15.10
11.8
14.23
13.14
, http://www.100md.com
13.63
10.3
8.53
9.02
9.76
15.6
8.75
8.43
9.10
12.7
15~
14.83
14.46
, 百拇医药
15.44
11.4
14.34
13.40
14.12
9.7
8.98
9.12
9.94
12.4
8.98
8.55
9.30
, 百拇医药
12.0
20~
15.30
14.64
15.77
10.2
14.23
13.69
14.62
9.4
9.38
9.23
10.09
, 百拇医药
12.1
8.79
8.68
9.51
11.8
25~
15.23
14.82
16.11
9.9
14.12
13.95
15.10
, 百拇医药
8.9
9.46
9.34
10.27
12.1
8.79
8.82
9.72
12.0
30~
15.18
15.00
16.44
, 百拇医药
9.7
14.19
14.23
15.60
10.1
9.64
9.44
10.44
11.7
9.02
8.95
9.92
12.2
, 百拇医药
35~
15.12
15.19
16.76
10.7
14.70
14.50
16.09
11.0
9.83
9.55
10.60
12.7
, 百拇医药
9.42
9.07
10.13
12.3
40~
15.41
15.37
17.10
11.3
15.32
14.78
17.06
14.8
, 百拇医药
10.05
9.66
10.76
13.6
9.76
9.20
10.35
14.4
45~
15.61
15.55
17.44
13.2
, http://www.100md.com
15.39
15.04
17.75
15.1
10.23
9.76
10.93
13.9
9.78
9.34
10.55
13.2
50~
, 百拇医药
15.79
15.73
17.76
14.2
16.09
15.32
18.06
20.0
10.25
9.87
11.11
13.7
9.88
, 百拇医药
9.48
10.76
16.7
55~
16.98
15.92
18.10
17.8
16.85
15.59
18.55
20.0
10.35
, 百拇医药
9.98
11.28
15.3
9.95
9.66
10.97
15.4
60~
16.98
16.09
18.43
18.8
17.56
, 百拇医药
15.87
19.05
19.7
10.25
10.08
11.44
17.1
10.04
9.72
11.19
17.0
65~
17.84
, 百拇医药
16.28
18.77
17.8
17.92
16.13
19.54
22.6
9.98
10.19
11.61
17.7
9.86
9.84
, 百拇医药
11.38
17.9
70~80
18.07
17.21
19.26
25.5
19.02
16.53
19.78
24.0
9.78
10.35
, http://www.100md.com
11.85
20.4
9.79
10.04
11.70
19.0
图1 男性收缩压与年龄的LS回归与LA回归 图2 女性收缩压与年龄的LS回归与LA回归
3 讨论
3.1 年龄是影响血压值高低的一个重要的混杂因素,它们之间呈明显的正相关关系。本文研究结果与之吻合。目前血压参考值定为39岁以下收缩压上限为18.62Kpa,随后每增加10岁,收缩压相应增加1.33KPa。也有生理学书籍介绍[1],青年时收缩压、舒张压的正常值为15.96KPa/10.64KPa以下;50岁以前为18.62KPa/11.97KPa以下;50岁以后为21.28KPa/12.64KPa以下。笔者认为,制订血压参考值应考虑以下几个问题:(1)年龄跨度不宜太大,要保下数据的连续性,应用时能按实际年龄判断。(2)要考虑年龄增加时,血压值的变异也随之增加,血压值并非阶梯式递增。(3)所选择的统计方法应能正确描述数据的分布。由表2及图1、图2中实线部分可见,在低年龄段时,由于变异系数较小,参考值上限与该年龄段的平均值接近,即参考值范围较窄;而在高年龄段时,变异系数增大,参考值上限与该年龄段平均值的差值也增加,即参考值范围也增宽,这一结论与临床实际情况相符。
, http://www.100md.com
3.2 传统的直线回归中用最小二乘法的原理得到回归方程,它要求数据独立,方差齐性及因变量正态分布。而人体的血压值分布呈偏态,且方差不齐。由图1、图2中虚线部分可见,按最小二乘法得到的各年龄段参考值上限与所在年龄段均数的距离均相等,也就是参考值上限与回归直线平均,它没有反映出各年龄段的变异情况,与实际情况相悖。本文选用的百分位数回归法采用加权最小一乘法估计回归系数,该法适用于因变量的分布不是正态或方差不为常数的资料,能有效地估计给定自变量x时,因变量y的中位数、百分位数及参考值范围等。据stuart和ord介绍[2],这种方法早在1757年就提出了,但由于计算复杂,并未得到普遍应用,近代统计学研究发现最小二乘回归有时并不理想,特别当数值变异较大时,所拟合的直线就会产生偏离致稳定性差。随着计算机应用的迅猛发展,百分位数回归方法又逐渐被重视,现在许多统计软件如SYSTATA等均提供了中位数回归或百分位数回归的算法。
3.3 有研究者调查上海112419例人体血压值得到各年龄段的血压平均值[3],其工作量之大、费用之高可想而知。我们仅用5000例血压调查值得到各年龄段参考值范围及平均值,并与临床实际情况相符。百分位数回归不仅适用于人体血压和年龄关系的研究,对其它具有同样性质的资料也适用。
参考文献
1 何瑞荣主编.心血管生理学.人民卫生出版社,1987,129.
2 Stuart A and ord JK.kendall’s Advanced Theory of Statistics. Vol2(5). New York: oxford university Press. 1991.
3 杨树勤主编.中国医学百科全书.医学统计学.上海科学技术出版社,1985,145~152.
收稿日期:1998-12-16, 百拇医药