自适应模糊偏最小二乘方法在药物构效关系建模中的应用
非线性偏最小二乘,,非线性偏最小二乘,模糊推理系统,神经网络,药物定量药效关系,H,IV21蛋白酶抑制剂
自适应模糊偏最小二乘方法在药物构效关系建模中的应用成 忠 陈德钊
3
吴晓华 叶子青
(浙江大学化学工程系仿真中心,杭州310027)
摘 要 作为一种局部逼近方法,自适应神经模糊推理系统(ANF IS)适于为药物定量构效关系(QSAR)建模。
描述药物分子结构的参数较多,常存在耦合关系,会增加建模难度,并影响模型的预报性能。为此,将ANF IS
和偏最小二乘( PLS)相结合,先由PLS从样本数据中提取成分,再由ANF IS实现每对成分间的非线性映射,并
基于输出误差进一步修正所提取的成分,使之对因变量具有最优的解释能力,由此构建为EB2AFPLS方法。
该法已成功地应用于H IV21蛋白酶抑制剂的QSAR建模,效果良好,显示出很强的学习能力,所建模型的预报
性能也优于其它方法。
关键词 非线性偏最小二乘,模糊推理系统,神经网络,药物定量药效关系, H IV21蛋白酶抑制剂
2004205220收稿; 2005201231接受
本文系国家自然科学基金项目(No. 20276063 ) 、浙江省重点科技项目(No. 2004C21SA120002 ) 和杭州市科技发展项目(No.
2003131B07)
1 引 言
药物定量构效关系( quantitative structure2activity relationship, QSAR)多为非线性的[ 1, 2 ] ,常用实验测
定的和理论计算的参数表示分子结构,局部效应显著,然而随着参数增多,会存在复共线性,将影响建模
的稳定性。可用非线性偏最小二乘( non2linear partial least squares, NLPLS)方法,从自变量、因变量中成
对地提取最优成分,消除复共线性,再令成对成分进行非线性逼近[ 3~5 ] 。多项式和多层前传网(multi2
layer feedforward network, MLFN)均为全局逼近,且低次多项式逼近精度有限,高次的会引起振荡,MLFN
则易造成过拟合或欠拟合。
基于模糊逻辑的模糊推理系统,能以任意精度逼近非线性函数[ 6, 7 ] ,此为局部逼近,拟合良好,预报
精度较高[ 8 ] 。本研究拟将基于自适应神经模糊推理系统( adap tive neuro2fuzzy inference system,ANF IS) ......
您现在查看是摘要页,全文长 16547 字符。