当前位置: 首页 > 期刊 > 《医学信息》 > 2022年第4期
编号:448456
医学知识图谱自动构建研究
http://www.100md.com 2022年3月11日 医学信息 2022年第4期
实体,1医学知识图谱构建,2医学知识图谱应用,3总结
     马 浩,戴国琳,刘新遥,万艳丽

    (中国医学科学院医学信息研究所,北京 100020)

    随着我国医疗技术的发展和医疗领域信息化水平的提升,生物医学文献、电子病历等大量的数据迅速产生,这给医学的发展提供了重要的资源。如何合理、有效地利用海量医学数据成为了一项重要的研究课题。知识图谱最早是谷歌的一个知识库,它使用语义检索来提高谷歌搜索的质量[1]。知识图谱的基本组成是“实体-关系-实体”三元组和“实体-属性-属性值”对,其具有强大的语义处理能力,能够对医学知识进行合理的表示及利用,为医学的发展提供有力支持。医学知识图谱也是知识图谱应用的重要领域之一,目前医学领域经典的医学知识图谱有北京大学、郑州大学和鹏城实验室构建的中文医学知识图谱[2]、上海曙光医院构建的中医药知识图谱[3]、中国中医科学院构建的中医临床知识图谱[4]、中医养生知识图谱[5]等。本文主要对医学知识图谱的自动构建情况进行总结,以期为医学知识图谱的构建及应用提供借鉴。

    1 医学知识图谱构建

    构建医学知识图谱首先需要从非结构化、半结构化的数据源中,通过知识抽取和知识融合技术得到结构化的知识并将其存储于数据库中,形成的医学知识图谱可以支持构建医疗语义搜索引擎、医疗问答系统和医疗决策支持系统,具体构建流程见图1。

    图1 医学知识图谱构建流程

    1.1 命名实体识别 命名实体识别的概念在1996 年的MUC-6 会议上被提出,当时用来识别文本中的人名、机构名和地理位置[6]。在医学领域中,命名实体主要包括疾病名、药物名等。命名实体识别早期一般采用基于规则和词典的方法,此种方法可以取得较高的准确率,但召回率较低,规则构建的难度较大,迁移性较差。机器学习的方法一般把命名实体识别看作是序列标注任务,常用的模型有支持向量机(support vector machine ......

您现在查看是摘要页,全文长 7986 字符