当前位置: 首页 > 期刊 > 《医学信息》 > 202014
编号:13845548
电子病历术语规范化流程及临床辅助诊断系统设计(2)
http://www.100md.com 2020年4月9日 《医学信息》 202014
     2.2电子病历文本的自然语言处理相关技术

    2.2.1汉语分词 主要方法如下:①基于词典的分词方法,包括正向最大匹配、逆向最大匹配法、双向匹配法、最少切分法[3];②基于统计的方法,包括统计语言模型[3]、基于HMM的方法[4]、由字构词法[5]等。

    2.2.2词性标注 尽管汉语言词性标注有些情况较为复杂,但医学术语涉及专业领域,大多数医学术语可直接标注为名词词形,便于简化词性标注的复杂度。

    2.2.3医学术语命名实体识别 近年来,随着临床信息化的发展和电子病历开始在临床中逐渐普及,我国学者开始对生物医学领域内的专有名词进行智能识别。在电子病历中,命名实体的类别繁多,除了时间、人名、地名、组织机构等常见的实体类别外,还有疾病、症状、手术操作、病因、病理、药品等特有的实体类别。在电子病历中,涉及到辅助诊断的几类实体是疾病、临床症状、手术操作、实验室检查等。目前,命名实体的识别方法主要有3种:①基于词典的方法:需要建立临床规范标准的医学专业术语集,要涵盖医学的各个领域,如SNOMED CT等中描述的相关的同义词、变形词,建立不规范和规范术语的映射等等 ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 4490 字符