当前位置: 首页 > 期刊 > 《百科知识》 > 201321
编号:13712525
大数据知多少

     每一年,IT界都会有一个最流行的话题——去年是“云计算”,今年则是“大数据”。美国互联网数据中心指出,互联网上的数据每年增长50%,每两年便翻一番,而目前世界上90%以上的数据是最近几年才产生的。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府甚至将大数据定义为“未来的新石油”。

    随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代。

    什么是大数据?

    大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理的信息。从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。

    业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。

    一是数据体量巨大(Volume)。从TB级别,跃升到PB级别。有数据显示,到2012年为止,人类生产的所有印刷材料的数据量大约是200PB(1PB=1024TB),全人类历史上说过的所有话的数据量大约是5EB(1EB=1024PB)。举例来说,1PB相当于154万张770MB光盘的数据容量,1ZB相当于全球每个人每天都去做1.19亿次高分辨率的核磁共振检查所产生的数据总量。

    二是数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这就对数据的处理能力提出了更高要求。

    三是价值密度低(Value)。以视频为例,在1小时连续不间断的监控过程中,有用数据可能仅有一二秒。

    四是处理速度快(Velocity)。这是大数据区别于传统数据挖掘技术的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。

    大数据应用

    从市场上已经发生的案例来看,互联网行业、零售行业受大数据的影响最大,医疗、卫生、交通、物流甚至生物科技、天文等领域也都开始意识到大数据的价值。

    互联网行业

    雅虎于2008年年初便开始启用大数据技术,每天分析超过200PB的数据,这使得雅虎的服务变得更人性化,更贴近用户和客户。为了更深入地了解每一个用户,亚马逊不仅从每个用户的购买行为中获得信息,还将每个用户在其网站上的所有行为都记录下来,这些数据的有效分析使得亚马逊对于客户的购买行为和喜好有了全方位了解,对其货品库存、仓储、物流以及广告业务上都有着极大的效益回馈。

    零售行业

    英国最大的连锁超市Tesco (特易购,国内称乐购)已经开始运用大数据技术采集并分析其客户行为信息。特易购首先在大数据系统内给每个顾客确定一个编号,然后通过顾客的刷卡消费、填写调查问卷、打客服电话等行为采集他们的相关数据,再用计算机系统建立特定模型,对每个顾客的海量数据进行分析,得出顾客的消费习惯、近期可能的消费需求等结论,以此来制定有针对性的促销计划并调整商品价格。这种有的放矢的营销和定价模式为特易购提供了更加高效的盈利方法。

    医疗行业

    医疗行业早就遇到了海量数据的挑战,很多国家都在积极推进医疗信息化发展,这一切都离不开大数据分析。

    在临床操作方面,大数据有5个主要应用:1.通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。2.大数据分析技术将使临床决策支持系统(分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应)更智能,这得益于对非结构化数据的分析能力的日益加强。3.通过提高医疗过程数据的透明度,间接促进医疗服务质量的提高。公开发布医疗质量和绩效数据还可以帮助病人做出更明智的健康护理决定。4.通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。5.在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。

    大数据的使用可以改善公众健康监控。公共卫生部门可以通过覆盖全国的患者电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。通过提供准确和及时的公众健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染风险。所有的这些都将帮助人们创造更健康生活。

    交通行业

    在交通管理上,大数据成为助力智慧交通发展的必然选择。

    不久前,爱尔兰首都都柏林已与IBM合作,利用实时数据来简化公共交通。大数据策略帮助该地区的公交车顺畅运行。都柏林的交通控制站能够利用数据定位公交车的实时位置。管理人员得以快速将公交网络中潜在的问题可视化。例如,管理人员可以确定拥堵区域,并在拥堵蔓延到其他交通干线之前找出问题的根源。大数据在交通管理上的应用大大优化了交通状况,而且节约了行政资源。

    在国内,上海正在构建通过物联网技术支撑的公共汽车运行信息发布系统,市民可以利用智能手机,查询公交线路和实时运行信息。无独有偶,南京市基于强大的云平台运行智慧交通云系统、云视频监控和智能分析应用,对整个南京140万辆机动车的交通数据进行实时查询和分析,并主动报警、主动通知用户。

    实际上,大数据运用在交通中除了能提供实时的交通数据,进行路况预警外,在未来城市的规划中也起着举足轻重的作用。

    通过收集数据,进行车流量的统计,再进一步对这些数据进行分析就能够将交通信息可视化,对同时段不同区域拥堵原因做出分析,这种分析为如何规划道路,是拓宽还是改道提供了参考的标准。大数据的应用一方面通过预警疏散交通压力,一方面为合理规划提供参考,可谓双管齐下。

    在这个过程中,我们让整个社会变得更加环保,成为更加集约型的社会。这都是大数据在智慧交通上具体的体现。

    大数据会给我们带来生活方式的变革,但是它的应用也并不是十全十美。除了信息数据采集会存在偏差、数据会受到市场的干扰以外,当个人生活和信息都被化为数据记录在数据供应商的手中时,个人信息安全如何保护将是每个人都要考虑的问题。

    【责任编辑】赵新宇(赵野)
    婵犵數鍎戠徊钘壝洪悩璇茬婵犻潧娲ら閬嶆煕濞戝崬鏋ゆい鈺冨厴閺屾稑鈽夐崡鐐差潾闁哄鏅滃Λ鍐蓟濞戞ǚ鏋庨煫鍥ㄦ尨閸嬫挻绂掔€n亞鍔﹀銈嗗坊閸嬫捇鏌涢悩宕囥€掓俊鍙夊姇閳规垿宕堕埞鐐亙闁诲骸绠嶉崕鍗炍涘☉銏犵劦妞ゆ帒顦悘锔筋殽閻愬樊鍎旀鐐叉喘椤㈡棃宕ㄩ鐐靛搸婵犵數鍋犻幓顏嗗緤閹灐娲箣閻樺吀绗夐梺鎸庣箓閹峰宕甸崼婢棃鏁傜粵瀣妼闂佸摜鍋為幐鎶藉蓟閺囥垹骞㈤柡鍥╁Т婵′粙鏌i姀鈺佺仩缂傚秴锕獮濠囨晸閻樿尙鐤€濡炪倖鎸鹃崑鐔哥閹扮増鈷戦柛锔诲帎閻熸噴娲Χ閸ヮ煈娼熼梺鍐叉惈閹冲氦绻氶梻浣呵归張顒傜矙閹烘鍊垫い鏂垮⒔绾惧ジ鏌¢崘銊モ偓绋挎毄濠电姭鎷冮崟鍨杹閻庢鍠栭悥鐓庣暦濮椻偓婵℃瓕顦抽柛鎾村灦缁绘稓鈧稒岣块惌濠偽旈悩鍙夋喐闁轰緡鍣i、鏇㈡晜閽樺鈧稑鈹戦敍鍕粶濠⒀呮櫕缁瑦绻濋崶銊у幐婵犮垼娉涢敃銈夊汲閺囩喐鍙忛柣鐔煎亰濡偓闂佽桨绀佺粔鎾偩濠靛绀冩い顓熷灣閹寸兘姊绘担绛嬪殐闁哥姵鎹囧畷婵婄疀濞戣鲸鏅g紓鍌欑劍宀e潡鍩㈤弮鍫熺厽闁瑰鍎戞笟娑㈡煕閺傚灝鏆i柡宀嬬節瀹曟帒顫濋鐘靛幀缂傚倷鐒﹂〃鍛此囬柆宥呯劦妞ゆ帒鍠氬ḿ鎰磼椤旇偐绠婚柨婵堝仱閺佸啴宕掑鍗炴憢闂佽崵濞€缂傛艾鈻嶉敐鍥╃煋闁割煈鍠撻埀顒佸笒椤繈顢橀悩顐n潔闂備線娼уú銈吤洪妸鈺佺劦妞ゆ帒鍋嗛弨鐗堢箾婢跺娲寸€规洏鍨芥俊鍫曞炊閵娿儺浼曢柣鐔哥矌婢ф鏁Δ鍜冪稏濠㈣埖鍔栭崑锝夋煕閵夘垰顩☉鎾瑰皺缁辨帗娼忛妸褏鐣奸梺褰掝棑婵炩偓闁诡喗绮撻幐濠冨緞婢跺瞼姊炬繝鐢靛仜椤曨厽鎱ㄦィ鍐ㄦ槬闁哄稁鍘奸崹鍌炴煏婵炵偓娅嗛柛瀣ㄥ妼闇夐柨婵嗘噹閺嗙喐淇婇姘卞ⅵ婵﹥妞介、鏇㈡晲閸℃瑦顓婚梻浣虹帛閹碱偆鎹㈠┑瀣祦閻庯綆鍠栫粻锝嗙節婵犲倸顏柟鏋姂濮婃椽骞愭惔锝傛闂佸搫鐗滈崜鐔风暦閻熸壋鍫柛鏇ㄥ弾濞村嫬顪冮妶鍡楃瑐闁绘帪绠撳鎶筋敂閸喓鍘遍梺鐟版惈缁夋潙鐣甸崱娑欑厓鐟滄粓宕滃顒夋僵闁靛ň鏅滈崑鍌炴煥閻斿搫孝閻熸瑱绠撻獮鏍箹椤撶偟浠紓浣插亾濠㈣泛鈯曡ぐ鎺戠闁稿繗鍋愬▓銈夋⒑缂佹ḿ绠栭柣鈺婂灠閻g兘鏁撻悩鑼槰闂佽偐鈷堥崜姘额敊閹达附鈷戦悹鍥b偓铏亖闂佸憡鏌ㄦ鎼佸煝閹捐绠i柣鎰綑椤庢挸鈹戦悩璇у伐闁哥噥鍨堕獮鍡涘磼濮n厼缍婇幃鈺呭箵閹烘繂濡锋繝鐢靛Л閸嬫捇鏌熷▓鍨灓缁鹃箖绠栭弻鐔衡偓鐢登瑰暩閻熸粎澧楅悡锟犲蓟濞戙垹绠抽柡鍌氱氨閺嬪懎鈹戦悙鍙夊櫣闂佸府绲炬穱濠囧箻椤旇姤娅㈤梺璺ㄥ櫐閹凤拷

   闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙婵☆偅锕㈤弻娑㈠Ψ閵忊剝鐝栭悷婊冨簻閹凤拷  闂傚倷鑳舵灙缂佺粯顨呴埢宥夊即閵忕姵鐎梺缁樺姉閸庛倝宕曞畝鍕厽闁逛即娼ф晶顔姐亜鎼搭垱瀚�  闂備浇宕垫慨鏉懨洪妶鍥e亾濮樼厧鐏︽い銏$懇楠炲鏁冮埀顒傜矆閸曨垱鐓熸俊顖濐嚙缁茶崵绱撳蹇斿  闂傚倷鑳堕幊鎾诲触鐎n剙鍨濋幖娣妼绾惧ジ鏌曟繛鐐珔闁告濞婇弻鈩冨緞鐎n亞鍔稿┑鈽嗗灲閹凤拷