智能在线提示系统及其在中医临床的应用(4)
第1页 |
参见附件。
方法步骤:①将语料库的病案文本,以标点、数字和现有术语为间隔,将其拆分成一段段的短语。理论上异名应该存在在这些短语中。②扫描每段短语,如果其中存在一个对象近义词和一个表现近义词,且两个词语的间隔不超过两个字时,将这两个词以及它们之间的部分提取出来,作为候选异名。间隔不超过两个字的原因是防止两个词来源于两个不同异名的情况,且通常情况下,异名病症不会很长。③对每个候选词条,看它们的对象词、表现词二元组的原义,是否和已有的正名对应。如果对应,则该异名很可能和该正名对应,否则它便不是个合适的异名,将其淘汰。
经过上述三个步骤,可以从语料库中发现较为贴切的异名病症名称。系统管理人员可以通过该方法,发现术语并进行人工筛除,能够便利快捷的充实数据库,减轻病症术语的非规范性对系统的影响。
算法步骤示例:
For(每条短语){
For(每个对象词异名)
For(每个表现词异名){
If(短语包含对象词异名&&短语包含表现词异名)then
If(两词间隔不超过2个字)then提取作为候选异名;
}
}
For(每个候选异名){
A1=候选异名中对象词对应的正名;
A2=候选异名中表现词对应的正名;
For(每个症状正名){
B1=症状正名中对象词对应的正名;
B2=症状正名中表现词对应的正名;
If (A1==B1 && A2==B2 && 症状正名候选异名) then 候选异名成为新异名;
}
}
4 系统评测实验
4.1量表提示实验 本研究所采用的量表为北京中医药大学东直门医院的高颖等编写的《缺血性中风证候要素诊断量表》[7]。使用系统对于10个出自中风相关论文的病案,运用量表方法进行了分析,结果如下。其中标红的证候是系统提示的证候。
病历病症描述原文:①患者于1994年3月4日在劳动中突然晕倒 ......
您现在查看是摘要介绍页,详见PDF附件。