数据挖掘算法在中药研究中的应用
吴地尧 章新友 甘宇汾 于思婷中图分类号 R28 文献标志码 A 文章编号 1001-0408(2018)19-2717-06
DOI 10.6039/j.issn.1001-0408.2018.19.28
摘 要 目的:为数据挖掘算法在中药研究中的进一步应用提供参考。方法:以“中药”“Apriori”“FP-growth”“层次聚类”“熵聚类”“决策树”“随机森林”“贝叶斯”“支持向量机”“人工神经网络”“logistic回归”“线性回归”等为关键词,组合查询2000年1月-2018年5月发表于中国知网、万方数据、维普网相关文献,对数据挖掘算法在中药研究各子领域中的应用现状进行综述。结果:共检索到相关有效文献573篇。数据挖掘算法较常应用在方剂配伍规律、药物分析、中药药性研究、制剂工艺研究等中药研究子领域,但在医案研究、谱效关系、量化诊断标准等子领域的应用较少。在各子领域中,以在方剂配伍规律研究中运用的数据挖掘算法种类最多,包括Apriori、FP-growth、层次聚类、熵聚类、决策树、人工神经网络、贝叶斯分类、logistic回归等,并以人工神经网络和支持向量机两种数据挖掘算法在中药研究各子领域中应用最广。结论:数据挖掘算法在中药研究各子领域中应用广泛,可为中药现代化研究提供有力的技术支持。
关键词 数据挖掘算法;中药研究;方剂配伍规律;药物分析;子领域
伴随着中药领域数据的暴涨[1],中药数据挖掘应运而生。中药数据挖掘是在中医药理理论指导下,对中药新药、中药组方规律、作用机制、有效成分和组效关系等多个方面进行深入挖掘的研究[2]。数据挖掘算法是根据数据的需要,创建数据挖掘模型的一系列探索和计算的方法。探讨数据挖掘算法在中药研究中的应用现状既可以直观地阐述中药研究领域中各数据挖掘算法的使用现状,也能更详尽地了解数据挖掘算法应用的特点及领域,拓展数据挖掘算法在中药研究中的应用,为各算法的深入研究提供参考和借鉴。
以数据挖掘任务为分类依据,对常用数据挖掘算法进行逐个统计和应用分析,数据挖掘能完成的任务总体可概括为两类——描述性任务和预测性任务[2]。描述性任务即刻画目标数据中数据的一般性质;预测性任务即在当前数据上进行归纳从而做出预测。这两类任务可划分为六类:特征化与区分、关联规则分析、分类分析、回归分析、聚类分析、离群点检测分析[3]。由于特征化与区分任务主要用于建立数据库及数据预处理,离群点检测任务大部分是由聚类分析方法完成[2],故在本文不对这两种任务做详细介绍。完成中药数据挖掘任务常用数据挖掘算法见图1 ......
您现在查看是摘要页,全文长 17193 字符。