聚类分析在中医药领域的研究进展
证型,证候,1聚类分析的研究概况,2聚类分析在中医药领域的应用,3小结
于芷涵 李 丹 闫朝升(黑龙江中医药大学医学信息工程学院,哈尔滨,150040)
中医药是我国优秀的传统文化。随着大数据技术向中医药各方面的不断深入,二者的有机结合使人类获取中医药信息资源更加方便,也为中医药发展带来了新的活力。另一方面,可以大大提高人们对中医药数据的使用效率,这必将为中医药行业的整体发展创造“大价值”。因此,通过大数据分析研究,推动中医药的研发和推广,将会对其产生重大的影响。在传统的辨证论治中,产生了大量的数据。如何在海量的大数据中快速、精确地获取最有价值的新知识,将为中医药领域提供前所未有的机遇和挑战。因此,通过大数据分析技术,将带动和促进中医临床领域与科研工作的蓬勃发展,抑或为中医药研究领域带来历史性改变。当前,聚类分析作为数据挖掘的一个方法,已根植于多个应用,包含智慧商业、图形模式识别、Web搜索技术等,并因其能够提高准确率等诸多优势,已经被广泛应用[1]。近些年来,有学者把聚类分析技术运用到了中医药领域,通过分析患者的临床特征等来对证候、证型进行归类,或对某种疾病进行用药规律的分析,对我国中医药数字化发展具有重要的指导意义。现将聚类分析在中医药领域的研究进行综述,以期为今后聚类分析在中医药临床研究等方面提供更多的思路和方法。
1 聚类分析的研究概况
1.1 聚类分析的概念 “物以类聚,人以群分”。聚类分析是把抽象的数据集分割成由相似内容所构成的若干个子集的过程。每个子集都是一个簇,簇中的内容相互类似,而与其他簇中的内容不类似。相异性与相似性依据所表示内容的属性值评估,通常涉及距离度量。在划分过程中,无须预先提出划分的标准,聚类分析能够从海量的样本中自发地做出分析。通过数年的发展,聚类分析技术已经在大数据分析的预处理、模式识别、计算机视觉、决策分析和预测等领域应用。
1.2 聚类分析的常用方法
如今正处于数据大爆发时期,聚类分析能够帮助人们在对数据一无所知的状况下,找到数据间的内在联系与差异,进而发现其内在的结构与规律性[2]。然而,在中医药与聚类分析进行结合的研究中,有部分聚类算法尚未涉及。因此,我们仅对使用频率较高的划分方法与层次方法进行较为详细的介绍。
1.2.1 划分方法 划分方法的基本思路是通过划分n个对象的集合体,构成数据的k(k≤n)个区域。其中每一分区都代表一个簇,且位于同一簇中的对象相似,不同簇中的对象相异。其中,K-means算法是聚类分析经典算法中的一种,由James MacQueen于1967年提出。初始簇中心的选择由数据集中随机挑选的k个目标确定 ......
您现在查看是摘要页,全文长 12415 字符。