基于文本挖掘的慢性咳嗽中医诊治规律研究(2)
1 资料与方法1.1 数据来源
检索范围:中国知识资源总库(CNKI),中文科技期刊数据库(VIP),中国学术期刊数据库(万方数据)及中国生物医学文献数据库(CBM)建库至2018年10月7日。本文的数据收集在检索词的层面不包含纯西医的条件,但包含中医和中西医结合的文献。在上述文献的基础上,为进一步精简相关文件,排除不包含中医证候、症状、复方、疾病的文献。
检索策略:CNKI为主题“慢性咳嗽”+全文“中医”或“中西医结合”;VIP为题名+关键词包含“慢性咳嗽”+“中医”或“中西医结合”;万方数据为主题“慢性咳嗽”+“中医”或者“中西医结合”;CBM为题目、关键词和摘要中检索“慢性咳嗽”+“中医”或“中西医结合”。
1.2 数据预处理
将数据整合至平面文本文件(TXT),以GB2312编码保存。然后利用专有的文本提取工具(软著登字第0261882号,登记号2010SR073409)将下载的非结构化文本数据进行格式化转换,并保存到大型关系型数据库MS SQL Server 2014中[6-7] ......
您现在查看是摘要页,全文长 4292 字符。