基于知识元的中医古籍文献研究述评
古籍整理,标引,1中医古籍的知识元研究方法,1基于知识元的研究方法,2知识元方法的理论基础,2基于知识元的中医古籍研究现状,3目前中医知识元研究存在的问题,1中医古籍的语义类型及语义关系研究尚处于初级阶段,2对中医古籍知识元的
王凤兰(中国中医科学院中国医史文献研究所,北京 100700)
相对于中医古籍所蕴含的极大价值而言,目前中医教育、科研、临床存在对中医古籍知识利用严重不足的现象,这与中医文献的研究方法固守传统,不能有所突破密切相关。事实上,领域内一些专家20世纪90年代起便对中医文献的研究方法提出前瞻性的看法,认为中医文献研究要探索和建立新的技术与方法,如采用实证的方法,使中医文献研究的水平进一步提高[1-2]。还有一些学者明确指出,中医文献研究要借鉴与利用信息技术,可为文献研究的开展提供广阔的发展空间[1,3-4]。更有学者基于中医数字化的研究方法认为,不仅要利用好信息技术,还要在文献研究中引入循证医学的思想,对中医古籍知识的证据级别进行评估[5]。
基于知识元的中医古籍文献研究方法是传统古籍整理研究结合信息技术所产生的新方法与新技术。文本主要基于知识元的知识表示方法取得的成就、存在的问题和未来可能的发展方向进行论述。
1 中医古籍的知识元研究方法
1.1 基于知识元的研究方法
基于知识元的研究方法由中医知识体、知识元、语义三部分组成。
1.1.1 中医知识体 知识体(Body knowledge, BK)是知识系统中可以独立表达一个特定主题的不可再分解的知识单元,是位于知识元上一层次的知识,由两个及以上对应同一主题的知识元聚合而成,通过体概念来描述。知识体对象表现为从自然文本中抽取出的包含有两个及以上对应同一主题知识元对象的一段连续的文字。在中医古籍的数字化建设中,知识体主要是指知识体系,如病证知识体、本草知识体、医案知识体等。由于这些知识的描述与表达是在特定语言背景下的,因此,其内容十分丰富,被学者们称之为“海量数据”[6]。同时,面向古籍的数字化需求,知识体亦可以应用于古籍的书体结构表达上,即一种古籍的卷、篇、章结构。在具体实施中,一种古籍的卷可以被视为是一个知识体,篇及章节等亦如此。因此,中医古籍的知识体既可以指代内容,亦可以指代结构。
1.1.2 中医知识元 知识元(Element knowledge,EK)是知识系统中可以表达一个完整概念的不可再分解的最小知识单元。在形式上它是由多个词语、词组或短语构成的集合,在内容上它表达一项相对完整的知识。知识元对象表现为从自然文本中抽取出的由词语、词组或短句构成的一段连续的文字。中医古籍的知识元十分丰富,有学者统计,中医古籍共包含217种不同属性的知识元[6]。知识元一般包含于一个特定的知识体内,如病证知识体所包含的知识元有19个之多 ......
您现在查看是摘要页,全文长 11936 字符。