当前位置: 首页 > 期刊 > 《医学信息》 > 2024年第1期
编号:441175
基于K-BERT 的中文妇产科电子病历实体识别研究
http://www.100md.com 2024年1月10日 医学信息 2024年第1期
命名,1研究背景及现状,2研究方法,3实验,4总结
     张 由,李 舫

    (上海电力大学计算机科学与技术学院,上海 201306)

    电子病历(electronic medical records)是医疗系统信息化的产物,是医务人员在其医疗活动过程中,使用医疗机构信息系统生成的关于病患的文字、符号、图标、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录[1]。随着医疗信息化的快速发展,电子病历已经成为医疗服务的重要基础设施之一。同时,智慧医疗已经成为医疗行业的新兴发展方向,电子病历作为智慧医疗的重要数据源之一,将对未来医疗的发展产生重要影响。在妇产科领域,电子病历的应用也日益广泛。由于妇产科疾病的特殊性和敏感性,电子病历可以更加全面、准确地记录妇产科患者的病历信息,对于提高医疗质量、优化医疗服务、保障女性健康具有重要意义。因此,研究妇产科电子病历对女性的意义已成为当前的热点问题,有望为妇产科领域的医疗服务提供更为优质的支持。命名实体识别(name entity recognition,NER)是指从非结构化文本中识别出具有特定意义的实体,如人名、地名、机构名等[2]。在电子病历中,由于病历信息的非结构化特点,传统的基于规则、关键词匹配或机器学习的方法无法满足实际需求。因此,采用深度学习等技术对电子病历进行命名实体识别已成为当前的研究热点之一。对于妇产科领域的电子病历数据进行NER 任务的研究也愈发重要。妇产科领域具有许多特殊的术语和专业知识,对于实现对电子病历中妇产科实体的自动识别,需要在语料库的构建、特征的选择、模型的训练等方面进行一系列的优化。同时,由于妇产科领域的疾病分类较为复杂,电子病历中的实体种类也更加繁多,对NER 任务的难度和要求提高了不少。通过NER 任务可以更加全面、准确地识别和记录妇产科患者的病历信息,为后续的医疗诊疗提供有力支持。

    1 研究背景及现状

    早期命名实体识别技术主要是基于规则、模板和特征工程等传统机器学习方法,其主要思路是通过手工设计规则、特征和模板等来提取实体特征并识别命名实体。这些方法依赖于领域专家的经验和先验知识,但是往往难以涵盖所有的实体类型和语境,因此在实际应用中往往表现不尽如人意。近年来由于深度学习发展迅速,越来越多的研究人员将相关技术运用到命名实体识别的研究上。这些方法可以自动学习语言特征,无需手工设计特征和规则,可以更好地适应不同的语境和实体类型,大大降低了人工成本。Lample G 等[3]提出双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)与条件随机场(Conditional Random Field ......

您现在查看是摘要页,全文长 12949 字符