基于机器学习技术挖掘中医名家医案数据的方法探讨
决策树,1医案数据的获取和预处理,1名家医案数据价值,2文本数据结构化,3数据预处理,4特征选择,2机器学习方法的选择,1无监督学习,2监督学习,3常用机器学习方法的特点,3结语
夏 鑫 ,牟 玮,李艳芬,黄宇虹1.天津中医药大学研究生院(天津 301617)
2.天津中医药大学第二附属医院临床药理中心(天津 300150)
中医药学是中华民族的伟大创造,是中国古代科学的瑰宝[1]。总结和传承中医名家的辨证思路、治法治则、用药规律等临床经验,通过数据挖掘技术提炼学术思想并予以推广,对丰富中医学理论体系,推动中医药发展意义重大而深远。
传统的医案群案研究主要以统计归纳方法为主,该方法适用于中医医案中病症、治疗方法等信息的频数统计、相关分析,对于揭示特点和规律有一定适用性,但在处理复杂关系和个体差异性方面存在局限,如难以处理多个因素的相互影响,以及多维非线性关系等复杂问题。随着人工智能技术的不断成熟,以及多学科交叉融合的研究和应用,机器学习方法作为数据挖掘技术的基本形式,有望在中医传承中得到广泛应用。中医理论和临床应用来源于长期大量的实践活动,而机器学习算法也是通过分析和学习数据总结规律和预测结果。从临床中发掘中医诊治规律更适合中医理论特点[2],机器学习算法可从大量数据中挖掘出中医证候特征和治疗用药规律,全面真实地发掘与传承中医名家的思辨体系和经验逻辑。
机器学习基于数学的理论和方法来构建和训练模型,实现对数据的学习和预测。利用机器学习方法将中医技术进一步标准化、形式化,既有助于中医技术的稳定传承和解析研究,又能推动中医的智能化发展。但是由于机器学习技术算法众多,不同机器学习算法都有其特点、适应和限制。挖掘名中医经验传承数据时,数据处理与获取以及算法选择对挖掘医案规律和构建名家诊治模型至关重要。本文对基于机器学习技术挖掘中医名家医案数据的不同方法进行探讨,为中医药相关研究人员提供一定参考。
1 医案数据的获取和预处理
1.1 名家医案数据价值
机器学习的基础是数据,高质量临床数据的获得对于数据规律的挖掘和机器模型的训练至关重要。尤其是面对临床真实情况的复杂多样,出于假设空间的满足,对数据量提出了更高的要求[3]。高质量且数量充足的数据,有助于提高模型的准确性和特殊情况的可靠性。传统中医主要通过四诊“望、闻、问、切”的方式采集信息,缺乏临床的客观指标和一致性标准,对于辨证诊断存在较大的主观性。加之中医关于中医的疗效判定问题,一直是个存在争议且未能得到根本解决的问题[4]。而名家医案作为解决临床疑难问题的典范,其诊断治疗思路和实践结果的有效性在长期的临床活动中得到了肯定,适宜作为用于机器学习的高质量数据来源。
1.2 文本数据结构化 ......
您现在查看是摘要页,全文长 16439 字符。