基于数据关联与文本挖掘技术的图书馆文献资源开发利用研究(3)
4.2 规范化数据挖掘流程基于数据关联与文本挖掘技术图书馆文献资源开发利用还要注意数据挖掘的规范化,保证数据的质量是首要工作,要对文献数据的字段和格式进行硬性的规范,并且要保证这种格式是持续遵循的,充分为以后的文本挖掘工作和图书馆网络平台建设打好基础。从图1可以看出,文献标引、数据录入与链接,都需要规范和监督,如遇不合格的情况,要及时返回上一流程重新校对和验证。图书馆必须对文献资源的数据挖掘层层把关 ......
您现在查看是摘要页,全文长 1821 字符。