支持向量机在中药神经毒性成分筛查中的应用(2)
本实验选用RBF核函数,其中(C,γ)由平行网格搜索法(parallel grid search)筛选,采用逐一交互验证的方法确定C和γ,取均方根偏差(RMS)最小时的C和γ,该方法可以在防止训练集过拟合的情况下找到构建模型的最优参数。1.3 模型验证
1.3.1 内部验证 构建好的模型用于预测测试集化合物,并对模型进行评价。模型的性能通过3个指标进行评价,分别是准确率(ACC,公式2),灵敏度(SE,公式3)和特异性(SP,公式4),其中TN,TP,FN,FP分别代表真阴性、真阳性、假阴性、假阳性。
ACC=(TP+TN)/(TP+FN+TN+FP)(2)
SE=TP/(TP+FN)(3)
SP=TN/(TN+FP)(4)
1.3.2 评价据文献报道确有神经毒性的中药成分 通过查阅文献[1-4,18-19]确定30个有神经毒性的中药成分作为外部验证集,见表1,来进一步评价模型的性能。
2 结果与讨论
2.1 分子描述符计算结果
PowerMV软件计算训练集化合物的分子描述符共计6 122个 ......
您现在查看是摘要页,全文长 4326 字符。