二次响应面回归模型在优选制药工艺条件中的应用
作者:仇丽霞 陈利民
单位:仇丽霞 山西医科大学卫生统计教研室(030001); 陈利民 山西省卫生厅
关键词:
中国卫生统计990123 二次响应面回归分析是研究最佳工艺条件、最佳配方、最佳居住条件等方面的一种非常有应用价值的方法。若考察的指标与影响因素满足二次函数关系,则二次响应面回归分析就可以从响应面的形状上找到最佳控制点,而且当曲面复杂时,即在研究设计的影响因素的不同水平中无最佳控制点时,还可通过岭嵴分析在试验范围之外,找到最佳控制条件,从而确定新的试验方向,以正确指导生产或试验。在木豆叶中总黄酮的提取过程中,经预试验知加水量(X1),煎煮时间(X2)、煎煮次数(X3)、煎煮温度(X4)将影响总黄酮的提取率。本文利用木豆叶总黄酮提取工艺的试验数据,探讨二次响应面回归分析在优选工艺条件时的应用,作者在AST微机上利用SAS软件完成,现报道如下:
, http://www.100md.com
资料与方法
1.资料的来源与设计:木豆叶黄酮类的提取条件采用四因素三水平的正交设计,重复试验四次〔1〕。
表1 试验因素及水平 水平
加水量(倍)
(X1)
煎煮时间(h)
(X2)
煎煮次数(次)
(X3)
煎煮温度(℃)
, 百拇医药
(X4)
1
12
0.75
3
100
2
10
1.0
2
90
3
8
, http://www.100md.com
1.5
1
80
表2 L9(34)正交试验结果 试验号
X1
X2
X3
X4
总黄酮含量(mg/g)
Y1
Y2
, 百拇医药
Y3
Y4
1
1
1
1
1
0.840
0.831
0.852
0.843
2
1
, http://www.100md.com
2
2
2
0.482
0.489
0.471
0.473
3
1
3
3
3
0.414
, http://www.100md.com 0.413
0.421
0.409
4
2
1
2
3
0.745
0.731
0.748
0.752
5
, http://www.100md.com 2
2
3
1
0.593
0.597
0.590
0.599
6
2
3
1
2
0.957
, 百拇医药
0.954
0.951
0.963
7
3
1
3
2
0.275
0.279
0.265
0.266
8
, http://www.100md.com
3
2
1
3
0.384
0.389
0.393
0.379
9
3
3
2
1
0.659
, http://www.100md.com
0.660
0.641
0.669
2.二次响应面回归模型〔2〕
(1)模型的拟合及方差分析:用Y表示响应变量(总黄酮含量),利用最小二乘法估计模型,通式为:=X'AX+b'X+C'Z
其中,A:二次型参数的对称阵,其中对角元素为二次项系数,非对角元素为交叉项系数;b:一次项系数;C:截距。
响应变量总平方和的划分:
Σ(Yi-)2=Σ(Yi-)2+Σ(-)2
, 百拇医药
其中,Σ(Yi-)2为残差平方和,由随机误差及模型拟合不足引起;Σ(i-)2为回归平方和,由模型引起。
(2)典型分析:求响应变量Y关于Xi的最佳值,X=-0.5A-1b,对应的点是稳定点,求A的特征值。判定曲面的形状及极值,当特征值均为正值时,为山谷形曲面,有极小值存在;当特征值为负值时,为山丘形曲面,有极大值存在;当特征值有正有负时,为马鞍形曲面,无极值存在。
(3)岭嵴分析:当稳定点是鞍点时,在原始设计中心X0的周围计算最佳响应岭嵴,定控制点。
, 百拇医药
结果与分析
1.模型的拟合及效果:表3显示,模型的F=3 587.0,P<0.0001,二次响应面回归模型有高度显著性;决定系数R2=0.9991,由四个影响因素引起的总黄酮含量的变异为99.91%;一次项、二次项均有显著性,其决定系数分别为0.5534和0.4456,一次项、二次项具有同等重要的作用;交叉项不存在,即因素间无交互作用。在残差部分,残差均由随机误差引起,不存在模型拟合不足的现象;见图1。
表3 总黄酮提取过程的二次响应面回归模型的方差分析
变异来源
v
SS
R2
, 百拇医药
F
P
回归部分
一次项
4
0.912665
0.5534
3973.9
<0.0001
二次项
4
0.734944
0.4456
, 百拇医药
3200.0
<0.0001
交叉项
0
0
总回归
8
1.647609
0.9991
3587.0
<0.0001
残差部分
模型拟合不足
, 百拇医药
0
0
随机误差
27
0.001550
总残差
27
0.001550
图1 预测值与残差值散点图
残差围绕零随机分布,cook距离均在±2之间(略),由此可见该试验数据拟合二次响应面回归模型的效果非常好。
, http://www.100md.com 由表4知,一次项、二次项均有显著性,由参数估计得二次响应面回归方程为:
表4 参数估计及检验
v
参数
标准误
t
P
截距
1
-2.944333
0.227206
, http://www.100md.com
-12.959
<0.0001
X1
1
1.318938
0.013417
98.300
<0.0001
X2
1
-2.648000
0.050051
, 百拇医药
-52.906
<0.0001
X3
1
0.347792
0.010827
32.122
<0.0001
X4
1
-0.058500
0.004825
, 百拇医药
-12.125
<0.0001
X21
1
-0.064198
0.000670
-95.900
<0.0001
X22
1
1.210667
, 百拇医药 0.021825
55.471
<0.0001
X23
1
-0.049292
0.002679
-18.399
<0.0001
X24
1
0.000376
, 百拇医药
0.00002679
14.029
<0.0001
由表5的方差分析结果可知:加水量(X1)和煎煮次数(X3)在试验过程中起主要作用,而煎煮时间(X2)、煎煮温度(X4)相对来说作用小一些。
表5 影响因素的方差分析
v
SS
MS
F
P
, 百拇医药
X1
2
0.644996
0.322498
5616.8
<0.0001
X2
2
0.226433
0.113216
1971.8
<0.0001
, 百拇医药
X3
2
0.563947
0.281973
4911.0
<0.0001
X4
2
0.212234
0.106117
1848.2
<0.0001
, 百拇医药
2.典型分析:表6中四个特征值有正有负,说明二次响应面为马鞍形,故无极值存在,在试验设计的影响因素的不同水平中无最佳控制点,需进一步作岭嵴分析,同时也可看到X2、X4与响应面的山谷相匹配,X1、X3与山丘相匹配。
表6 典型分析 特征值
特征向量
X1
X2
X3
X4
0.170250
, 百拇医药
0
1
0
0
0.037583
0
0
0
1
-0.049292
0
0
1
0
, 百拇医药
-0.256792
1
0
0
0
3.岭嵴分析:表7提示欲使总黄酮含量高,加水量(X1)、煎煮时间(X2)、煎煮次数(X3)、煎煮温度(X4)的值为增加的趋势,所以木豆叶总黄酮提取的最佳工艺条件为:加水量(X1)为木豆叶重量的10.2倍,煎煮时间(X2)1.5小时,煎煮3次,煎煮温度93℃。
表7 岭嵴分析
, 百拇医药
X1
X2
X3
X4
0.656167
10.0000
1.1250
2.0000
90.0000
0.674901
10.0595
1.1321
, 百拇医药
2.0778
90.5193
0.693059
10.0989
1.1441
2.1507
91.1078
0.711138
10.1247
1.1649
2.2130
91.7155
, 百拇医药
0.729880
10.1401
1.1988
2.2580
92.2312
0.750304
10.1480
1.2423
2.2841
92.5672
0.773243
10.1521
, http://www.100md.com
1.2879
2.2984
92.7648
0.799131
10.1545
1.3326
2.3070
92.8880
0.828166
10.1560
1.3759
2.3127
, http://www.100md.com
92.9715
0.860448
10.1571
1.4183
2.3168
93.0320
0.896029
10.1579
1.4597
2.3198
93.0781
小 结
, 百拇医药
二次响应面回归分析对木豆叶总黄酮提取工艺的优选是比较理想的方法。本次研究在试验范围内无最佳控制点,但通过岭嵴分析在试验范围之外找到了最佳控制点。与正交设计的方差分析相比,二次响应面回归分析能够更准确地指明最佳控制条件,而方差分析仅能从试验预先设定的几个水平中优选组合,因此方差分析得到的最佳工艺条件,并非真实意义的最佳条件,只能说是理想条件。另外二次响应面中的岭嵴分析还可在曲面复杂时,在试验范围之外找到最佳控制点,从而确定新的试验方向,这是正交设计的方差分析所不能比拟的。
当然二次响应面回归分析对资料的要求上没有方差分析那么宽松,本次研究中煎煮次数(X3)是非连续性的数值变量,因此在决定该因素的水平时,我们只能从岭嵴分析的趋势上定为3次。故此,在应用该法时影响因素不能是定性的指标。
(感谢本室何大卫教授的悉心指导!)
参考文献
1.刘中秋,等.生脉成骨片中木豆叶提取工艺研究.中成药 1998;20(3):7~9
2.北京大学概率统计系,主编.SAS系统使用手册,北京:北京大学新技术公司,1993:8
3.金丕焕,主编.医学统计学方法.上海:上海医科大学出版社,1993:90, http://www.100md.com
单位:仇丽霞 山西医科大学卫生统计教研室(030001); 陈利民 山西省卫生厅
关键词:
中国卫生统计990123 二次响应面回归分析是研究最佳工艺条件、最佳配方、最佳居住条件等方面的一种非常有应用价值的方法。若考察的指标与影响因素满足二次函数关系,则二次响应面回归分析就可以从响应面的形状上找到最佳控制点,而且当曲面复杂时,即在研究设计的影响因素的不同水平中无最佳控制点时,还可通过岭嵴分析在试验范围之外,找到最佳控制条件,从而确定新的试验方向,以正确指导生产或试验。在木豆叶中总黄酮的提取过程中,经预试验知加水量(X1),煎煮时间(X2)、煎煮次数(X3)、煎煮温度(X4)将影响总黄酮的提取率。本文利用木豆叶总黄酮提取工艺的试验数据,探讨二次响应面回归分析在优选工艺条件时的应用,作者在AST微机上利用SAS软件完成,现报道如下:
, http://www.100md.com
资料与方法
1.资料的来源与设计:木豆叶黄酮类的提取条件采用四因素三水平的正交设计,重复试验四次〔1〕。
表1 试验因素及水平 水平
加水量(倍)
(X1)
煎煮时间(h)
(X2)
煎煮次数(次)
(X3)
煎煮温度(℃)
, 百拇医药
(X4)
1
12
0.75
3
100
2
10
1.0
2
90
3
8
, http://www.100md.com
1.5
1
80
表2 L9(34)正交试验结果 试验号
X1
X2
X3
X4
总黄酮含量(mg/g)
Y1
Y2
, 百拇医药
Y3
Y4
1
1
1
1
1
0.840
0.831
0.852
0.843
2
1
, http://www.100md.com
2
2
2
0.482
0.489
0.471
0.473
3
1
3
3
3
0.414
, http://www.100md.com 0.413
0.421
0.409
4
2
1
2
3
0.745
0.731
0.748
0.752
5
, http://www.100md.com 2
2
3
1
0.593
0.597
0.590
0.599
6
2
3
1
2
0.957
, 百拇医药
0.954
0.951
0.963
7
3
1
3
2
0.275
0.279
0.265
0.266
8
, http://www.100md.com
3
2
1
3
0.384
0.389
0.393
0.379
9
3
3
2
1
0.659
, http://www.100md.com
0.660
0.641
0.669
2.二次响应面回归模型〔2〕
(1)模型的拟合及方差分析:用Y表示响应变量(总黄酮含量),利用最小二乘法估计模型,通式为:=X'AX+b'X+C'Z
其中,A:二次型参数的对称阵,其中对角元素为二次项系数,非对角元素为交叉项系数;b:一次项系数;C:截距。
响应变量总平方和的划分:
Σ(Yi-)2=Σ(Yi-)2+Σ(-)2
, 百拇医药
其中,Σ(Yi-)2为残差平方和,由随机误差及模型拟合不足引起;Σ(i-)2为回归平方和,由模型引起。
(2)典型分析:求响应变量Y关于Xi的最佳值,X=-0.5A-1b,对应的点是稳定点,求A的特征值。判定曲面的形状及极值,当特征值均为正值时,为山谷形曲面,有极小值存在;当特征值为负值时,为山丘形曲面,有极大值存在;当特征值有正有负时,为马鞍形曲面,无极值存在。
(3)岭嵴分析:当稳定点是鞍点时,在原始设计中心X0的周围计算最佳响应岭嵴,定控制点。
, 百拇医药
结果与分析
1.模型的拟合及效果:表3显示,模型的F=3 587.0,P<0.0001,二次响应面回归模型有高度显著性;决定系数R2=0.9991,由四个影响因素引起的总黄酮含量的变异为99.91%;一次项、二次项均有显著性,其决定系数分别为0.5534和0.4456,一次项、二次项具有同等重要的作用;交叉项不存在,即因素间无交互作用。在残差部分,残差均由随机误差引起,不存在模型拟合不足的现象;见图1。
表3 总黄酮提取过程的二次响应面回归模型的方差分析
变异来源
v
SS
R2
, 百拇医药
F
P
回归部分
一次项
4
0.912665
0.5534
3973.9
<0.0001
二次项
4
0.734944
0.4456
, 百拇医药
3200.0
<0.0001
交叉项
0
0
总回归
8
1.647609
0.9991
3587.0
<0.0001
残差部分
模型拟合不足
, 百拇医药
0
0
随机误差
27
0.001550
总残差
27
0.001550
图1 预测值与残差值散点图
残差围绕零随机分布,cook距离均在±2之间(略),由此可见该试验数据拟合二次响应面回归模型的效果非常好。
, http://www.100md.com 由表4知,一次项、二次项均有显著性,由参数估计得二次响应面回归方程为:
表4 参数估计及检验
v
参数
标准误
t
P
截距
1
-2.944333
0.227206
, http://www.100md.com
-12.959
<0.0001
X1
1
1.318938
0.013417
98.300
<0.0001
X2
1
-2.648000
0.050051
, 百拇医药
-52.906
<0.0001
X3
1
0.347792
0.010827
32.122
<0.0001
X4
1
-0.058500
0.004825
, 百拇医药
-12.125
<0.0001
X21
1
-0.064198
0.000670
-95.900
<0.0001
X22
1
1.210667
, 百拇医药 0.021825
55.471
<0.0001
X23
1
-0.049292
0.002679
-18.399
<0.0001
X24
1
0.000376
, 百拇医药
0.00002679
14.029
<0.0001
由表5的方差分析结果可知:加水量(X1)和煎煮次数(X3)在试验过程中起主要作用,而煎煮时间(X2)、煎煮温度(X4)相对来说作用小一些。
表5 影响因素的方差分析
v
SS
MS
F
P
, 百拇医药
X1
2
0.644996
0.322498
5616.8
<0.0001
X2
2
0.226433
0.113216
1971.8
<0.0001
, 百拇医药
X3
2
0.563947
0.281973
4911.0
<0.0001
X4
2
0.212234
0.106117
1848.2
<0.0001
, 百拇医药
2.典型分析:表6中四个特征值有正有负,说明二次响应面为马鞍形,故无极值存在,在试验设计的影响因素的不同水平中无最佳控制点,需进一步作岭嵴分析,同时也可看到X2、X4与响应面的山谷相匹配,X1、X3与山丘相匹配。
表6 典型分析 特征值
特征向量
X1
X2
X3
X4
0.170250
, 百拇医药
0
1
0
0
0.037583
0
0
0
1
-0.049292
0
0
1
0
, 百拇医药
-0.256792
1
0
0
0
3.岭嵴分析:表7提示欲使总黄酮含量高,加水量(X1)、煎煮时间(X2)、煎煮次数(X3)、煎煮温度(X4)的值为增加的趋势,所以木豆叶总黄酮提取的最佳工艺条件为:加水量(X1)为木豆叶重量的10.2倍,煎煮时间(X2)1.5小时,煎煮3次,煎煮温度93℃。
表7 岭嵴分析
, 百拇医药
X1
X2
X3
X4
0.656167
10.0000
1.1250
2.0000
90.0000
0.674901
10.0595
1.1321
, 百拇医药
2.0778
90.5193
0.693059
10.0989
1.1441
2.1507
91.1078
0.711138
10.1247
1.1649
2.2130
91.7155
, 百拇医药
0.729880
10.1401
1.1988
2.2580
92.2312
0.750304
10.1480
1.2423
2.2841
92.5672
0.773243
10.1521
, http://www.100md.com
1.2879
2.2984
92.7648
0.799131
10.1545
1.3326
2.3070
92.8880
0.828166
10.1560
1.3759
2.3127
, http://www.100md.com
92.9715
0.860448
10.1571
1.4183
2.3168
93.0320
0.896029
10.1579
1.4597
2.3198
93.0781
小 结
, 百拇医药
二次响应面回归分析对木豆叶总黄酮提取工艺的优选是比较理想的方法。本次研究在试验范围内无最佳控制点,但通过岭嵴分析在试验范围之外找到了最佳控制点。与正交设计的方差分析相比,二次响应面回归分析能够更准确地指明最佳控制条件,而方差分析仅能从试验预先设定的几个水平中优选组合,因此方差分析得到的最佳工艺条件,并非真实意义的最佳条件,只能说是理想条件。另外二次响应面中的岭嵴分析还可在曲面复杂时,在试验范围之外找到最佳控制点,从而确定新的试验方向,这是正交设计的方差分析所不能比拟的。
当然二次响应面回归分析对资料的要求上没有方差分析那么宽松,本次研究中煎煮次数(X3)是非连续性的数值变量,因此在决定该因素的水平时,我们只能从岭嵴分析的趋势上定为3次。故此,在应用该法时影响因素不能是定性的指标。
(感谢本室何大卫教授的悉心指导!)
参考文献
1.刘中秋,等.生脉成骨片中木豆叶提取工艺研究.中成药 1998;20(3):7~9
2.北京大学概率统计系,主编.SAS系统使用手册,北京:北京大学新技术公司,1993:8
3.金丕焕,主编.医学统计学方法.上海:上海医科大学出版社,1993:90, http://www.100md.com