大数据环境下开展医院图书馆信息服务浅析
摘要:本文在大数据的时代背景下,探讨了大数据的基本内涵与特征,它给医院图书馆信息服务方面带来的挑战,以及通过对大数据在医院图书馆信息服务方面的应用,期望能够为未来的医院图书馆信息服务创新体系提供一些参考。
关键词:大数据;信息服务;图书馆
大数据已成为2012年以来的研究热点。大数据被称为"碎片中的智慧",被视为驱动新一轮技术革命的关键力量,它正在显现出巨大的价值。根据麦肯锡咨询公司测算,大数据每年可为美国医疗服务业节省3000亿美元,使零售业净利润增长60%,帮助制造业在产品研发、组装等环节降低50%的成本。美国将大数据定义为"未来的新石油", 全球500强企业中90%以上的重要决策都取决于深入的数据挖掘和分析。大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。并随着近年来互联网和信息行业的发展而引起人们关注。
本文在大数据的时代背景下,探讨了大数据的基本内涵与特征,它给医院图书馆带来的挑战,以及通过对大数据在医院图书馆信息服务方面的应用,期望能够为未来的医院图书馆信息服务创新体系提供一些参考。
1大数据的内涵与特征
1.1大数据的内涵 大数据目前还没有统一的定义。维基百科定义大数据为巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。
1.2大数据的特征 大数据的特征归纳为4个"V"。①数据体量巨大。从TB级别,跃升到PB级别;②数据类型繁多。网络日志、视频、图片、地理位置信息等等。③处理速度快,1秒定律,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。④只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。业界将其归纳为4个"V"--Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)。
2大数据与图书馆
依据大数据定义,单体图书馆数据总量虽然还没有达到PB级,但从图书馆存储数据种类和数量以及未来发展趋势上来说,已经初步具备了大数据基本特征。图书馆除了馆藏的图书、期刊、论文等纸质资源外,还拥有大量的数据库资源、多媒体资源、电子图书、电子文档,还有图书馆管理系统信息。此外,伴随着平板电脑、智能手机等移动设备以及社交网络的出现,移动终端用户行为和服务等非结构化数据量逐年增加[1]。
2010年底,国家图书馆数字资源已达到480 TB,到"十二五"末,国家图书馆数字资源总量要达到1000 TB,每个省级数字图书馆可用数字资源量将达100 TB,每个市级数字图书馆可用数字资源量达30 TB,每个县级数字图书馆可用数字资源量达4 TB。文化共享工程将建设"公共文化数字资源基础库群",资源总量达到530 TB。
3大数据环境下对医院图书馆信息服务的挑战
当前数字时代,医院数字图书馆结构化资源内容丰富,结构完整,包括电子图书、电子期刊、电子报纸、数据库、网络资源在内的海量数字资源。非结构化数据如声音、视频、音频、图片等可视可听的数据,因为信息技术原因以及不够重视而缺乏。图书馆在此结构化资源基础上尽力实现用户的最大满意和最大程度利用。但在大数据时代,医学信息量以指数的态势增长。要求医院图书馆对医疗专业部门的支撑越来越强,医务工作者没有足够的时间和精力查询相关专业资讯,这就要求图书馆对医学专业具有较强的支撑能力,能够在浩如烟海的信息中找到最有效的信息,乃至参与医疗决策[2]。
4大数据环境下医院图书馆信息服务
大数据时代要求医院图书馆信息服务将向数据分析、数据挖掘方向转移,利用大量的结构化、非结构化、半结构化数据去挖掘读者行为,预测和分析读者的兴趣和潜在需求,从而主动的为用户提供个性化、精准化的信息服务。
4.1提供主动的、有针对性服务 医院图书馆的服务对象主要可以分为:临床医护人员、医技人员、科研人员、行政管理人员和进修生、实习生人员。显然,各类用户群对信息的需求差异很大,同一类用户群中因为层次不同,信息需求也存在较大差异。通过大数据平台的挖掘分析,区分开用户群,然后针对不同用户群开展不同层次的服务。医疗科研人员的学科专业性非常明显,信息需求主要集中在与专业领域紧密相关的生物医学文献上,不同专业的用户需求差异明显,而相同专业的用户具有相近的兴趣度,根据其相似性,可以得出某一时期某一学科的科研热点,以及该领域的研究进展,实时动态地为他们提供专属信息,提高文献推送效率,使医疗科研人员更快地洞察最新的科研走向。
4.2提供个性化、精准化服务 在大数据时代,用户面对众多数据资源,深受大数据所带来的困扰,很难方便、快捷、准确地检索到所需数据资料。图书馆可通过大数据分析平台对每个用户的检索关键词、浏览历史、下载数据、流量数据、读者留言、新书推荐以及其博客、微博、移动图书馆等各种社交媒体产生的交互信息的分析,挖掘每个用户的隐性信息需求,发现并预测其信息需求特点以及趋势,针对每个用户提供精准的、个性化的信息,以提高每个用户获取信息的速度和深度。
5加强大数据人才培养
大数据时代对医院图书馆工作提出了更高的信息服务标准,要求医院图书馆不但能够通过结构化数据了解现在医疗科研人员需要什么服务,也能够利用非结构化数据、半结构化数据深度挖掘预测和分析将来会发生什么。美国研究图书馆协会提出,研究数据管理是下一代图书馆员的能力之一。研究型生物医学专业图书馆应尽快引进或培养一支大数据管理专业队伍。当前的任务是如何在现有基础上,拓宽馆员知识面,增强业务能力,使之成为大数据知识服务信息资源的组织者、传播者、导航者和教育者[3]。
6对用户隐私的保护
大数据收集了用户的个人信息、搜索历史、地理位置等大量信息,很可能威胁到用户的隐私,让用户有知情权,个人数据保存期限和用途将有用户自行设置,这样既解除了用户的顾虑,图书馆又能合法的利用数据,在不暴露用户个人隐私的前提下为医疗科研人员提供优质的个性化服务。
7结论
大数据技术将有力推动医学信息服务向更深层次和更广范围拓展。医学图书馆员必须抓住发展机遇,不断提升核心竞争力,利用大数据创新信息服务,满足医疗科研人员日益增长的信息需求。
参考文献:
[1]王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013,33(3):81-83.
[2]宋倩.大数据时代医院图书馆发展定位研究[J].价值工程,2014,(18):222-223.
[3]陈锐,冯占英.大数据时代医学专业图书馆面临的挑战与对策[J].中华医学图书情报杂志,2014,23(1):2-6.
编辑/肖慧, http://www.100md.com(毕波)
关键词:大数据;信息服务;图书馆
大数据已成为2012年以来的研究热点。大数据被称为"碎片中的智慧",被视为驱动新一轮技术革命的关键力量,它正在显现出巨大的价值。根据麦肯锡咨询公司测算,大数据每年可为美国医疗服务业节省3000亿美元,使零售业净利润增长60%,帮助制造业在产品研发、组装等环节降低50%的成本。美国将大数据定义为"未来的新石油", 全球500强企业中90%以上的重要决策都取决于深入的数据挖掘和分析。大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。并随着近年来互联网和信息行业的发展而引起人们关注。
本文在大数据的时代背景下,探讨了大数据的基本内涵与特征,它给医院图书馆带来的挑战,以及通过对大数据在医院图书馆信息服务方面的应用,期望能够为未来的医院图书馆信息服务创新体系提供一些参考。
1大数据的内涵与特征
1.1大数据的内涵 大数据目前还没有统一的定义。维基百科定义大数据为巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。
1.2大数据的特征 大数据的特征归纳为4个"V"。①数据体量巨大。从TB级别,跃升到PB级别;②数据类型繁多。网络日志、视频、图片、地理位置信息等等。③处理速度快,1秒定律,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。④只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。业界将其归纳为4个"V"--Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)。
2大数据与图书馆
依据大数据定义,单体图书馆数据总量虽然还没有达到PB级,但从图书馆存储数据种类和数量以及未来发展趋势上来说,已经初步具备了大数据基本特征。图书馆除了馆藏的图书、期刊、论文等纸质资源外,还拥有大量的数据库资源、多媒体资源、电子图书、电子文档,还有图书馆管理系统信息。此外,伴随着平板电脑、智能手机等移动设备以及社交网络的出现,移动终端用户行为和服务等非结构化数据量逐年增加[1]。
2010年底,国家图书馆数字资源已达到480 TB,到"十二五"末,国家图书馆数字资源总量要达到1000 TB,每个省级数字图书馆可用数字资源量将达100 TB,每个市级数字图书馆可用数字资源量达30 TB,每个县级数字图书馆可用数字资源量达4 TB。文化共享工程将建设"公共文化数字资源基础库群",资源总量达到530 TB。
3大数据环境下对医院图书馆信息服务的挑战
当前数字时代,医院数字图书馆结构化资源内容丰富,结构完整,包括电子图书、电子期刊、电子报纸、数据库、网络资源在内的海量数字资源。非结构化数据如声音、视频、音频、图片等可视可听的数据,因为信息技术原因以及不够重视而缺乏。图书馆在此结构化资源基础上尽力实现用户的最大满意和最大程度利用。但在大数据时代,医学信息量以指数的态势增长。要求医院图书馆对医疗专业部门的支撑越来越强,医务工作者没有足够的时间和精力查询相关专业资讯,这就要求图书馆对医学专业具有较强的支撑能力,能够在浩如烟海的信息中找到最有效的信息,乃至参与医疗决策[2]。
4大数据环境下医院图书馆信息服务
大数据时代要求医院图书馆信息服务将向数据分析、数据挖掘方向转移,利用大量的结构化、非结构化、半结构化数据去挖掘读者行为,预测和分析读者的兴趣和潜在需求,从而主动的为用户提供个性化、精准化的信息服务。
4.1提供主动的、有针对性服务 医院图书馆的服务对象主要可以分为:临床医护人员、医技人员、科研人员、行政管理人员和进修生、实习生人员。显然,各类用户群对信息的需求差异很大,同一类用户群中因为层次不同,信息需求也存在较大差异。通过大数据平台的挖掘分析,区分开用户群,然后针对不同用户群开展不同层次的服务。医疗科研人员的学科专业性非常明显,信息需求主要集中在与专业领域紧密相关的生物医学文献上,不同专业的用户需求差异明显,而相同专业的用户具有相近的兴趣度,根据其相似性,可以得出某一时期某一学科的科研热点,以及该领域的研究进展,实时动态地为他们提供专属信息,提高文献推送效率,使医疗科研人员更快地洞察最新的科研走向。
4.2提供个性化、精准化服务 在大数据时代,用户面对众多数据资源,深受大数据所带来的困扰,很难方便、快捷、准确地检索到所需数据资料。图书馆可通过大数据分析平台对每个用户的检索关键词、浏览历史、下载数据、流量数据、读者留言、新书推荐以及其博客、微博、移动图书馆等各种社交媒体产生的交互信息的分析,挖掘每个用户的隐性信息需求,发现并预测其信息需求特点以及趋势,针对每个用户提供精准的、个性化的信息,以提高每个用户获取信息的速度和深度。
5加强大数据人才培养
大数据时代对医院图书馆工作提出了更高的信息服务标准,要求医院图书馆不但能够通过结构化数据了解现在医疗科研人员需要什么服务,也能够利用非结构化数据、半结构化数据深度挖掘预测和分析将来会发生什么。美国研究图书馆协会提出,研究数据管理是下一代图书馆员的能力之一。研究型生物医学专业图书馆应尽快引进或培养一支大数据管理专业队伍。当前的任务是如何在现有基础上,拓宽馆员知识面,增强业务能力,使之成为大数据知识服务信息资源的组织者、传播者、导航者和教育者[3]。
6对用户隐私的保护
大数据收集了用户的个人信息、搜索历史、地理位置等大量信息,很可能威胁到用户的隐私,让用户有知情权,个人数据保存期限和用途将有用户自行设置,这样既解除了用户的顾虑,图书馆又能合法的利用数据,在不暴露用户个人隐私的前提下为医疗科研人员提供优质的个性化服务。
7结论
大数据技术将有力推动医学信息服务向更深层次和更广范围拓展。医学图书馆员必须抓住发展机遇,不断提升核心竞争力,利用大数据创新信息服务,满足医疗科研人员日益增长的信息需求。
参考文献:
[1]王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013,33(3):81-83.
[2]宋倩.大数据时代医院图书馆发展定位研究[J].价值工程,2014,(18):222-223.
[3]陈锐,冯占英.大数据时代医学专业图书馆面临的挑战与对策[J].中华医学图书情报杂志,2014,23(1):2-6.
编辑/肖慧, http://www.100md.com(毕波)