当前位置: 首页 > 期刊 > 《医学信息》 > 2023年第10期
编号:448805
面向机器学习的智慧诊疗语料库构建研究
http://www.100md.com 2023年5月23日 医学信息 2023年第10期
医学,1国内外语料库研究现状动态分析,2智慧诊疗语料库构建方法,3语料库建设成果及优劣势分析,4面向机器学习的智慧诊疗语料库应用分析,5总结
     凌 天,焦 阳,狄碧云,翁晓兰,李露芳

    (浙江中医药大学图书馆,浙江 杭州 310053)

    在健康中国战略背景下,效率较低的医疗体系、质量欠佳的医疗服务、看病难且贵的就医现状已成为社会关注焦点,反映医疗资源与需求不平衡的突出问题。在2016 年中共中央政治局审议通过的《“健康中国2030”规划纲要》中,强调全面建成统一权威、互联互通的人口健康信息平台,规范和推动‘互联网+健康医疗’服务。智慧医疗可提供更优质的医疗服务,保障人民健康。以语料库为支撑的辅助诊疗终端如医用机器人、虚拟家庭医生护理等方式提供智慧诊疗服务是当下智慧医疗发展的前沿趋势之一。而语料库是遵循特定标准采集而来的能够代表某种语言特征的数据集,可从规模化语料集中精确提取语料,挖掘出隐藏价值信息,联合定性与定量方法研究关联数据组织成知识加以利用。随着人工智能与大数据新兴理论发展,机器学习技术得以兴起,通过学习样本数据内在关联与特征表现获得计算机语言所理解的文字、图像和声音等数据,其最终目标是让计算机像人一样具有分析学习能力,能够识别语音和图像等数据。将机器学习技术应用于语料库建设,可明显降低项目成本与工作量。因此,本研究将语料库与现代医学结合,构建基于机器学习的智慧诊疗语料库,将复杂的疾病症状、准确的临床检查、有效的治疗措施以及详实的随诊病历等汇聚成一体化的数据工程,以期让机器“学习”专家主任级医师诊疗经验,模拟诊疗时的思维逻辑,并在实际应用时给出可行性诊治方案,以智慧诊疗的方式解决医疗资源与需求不平衡问题等社会问题。

    1 国内外语料库研究现状动态分析

    1.1 国外研究现状 语料库起源于语言学研究,以单种语言—英语类为主。在20 世纪60 年代初,英语语言学家Francis 和Kucera[1]建立世界上首个英语文本语料库—布朗语料库。在20 世纪80 年代,随着科学技术的不断发展,语料语言学研究领域扩展到基于平行语料库的英汉互译、文学作品和文学家语言风格甚至医学研究等。目前国外已建成且较有影响的主要有英国国家语料库The British National Corpus(BNC)[2]与美国传统中介语料American Heritage Intermediate Corpus(AHI)[3],世界著名英语教学与英语字典语料库。医学研究主要有Mollá D 等[4]提出了一个基于循证医学文本处理的语料库,该语料库是基于家庭临床杂志的临床查询部分文本信息。

    1.2 国内研究现状 在20 世纪90 年代以来,国内专家基于语言学对语料库展开论证研究 ......

您现在查看是摘要页,全文长 11683 字符