当前位置: 首页 > 新闻 > 信息荟萃
编号:5473
大数据架构详解豆瓣版无需密码.pdf
http://www.100md.com 2020年11月12日
第1页
第10页
第20页
第28页
第47页
第179页

    参见附件(132017KB,374页)。

     大数据架构详解:从数据获取到深度学习,这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。

    内容简介

    本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:第一部分从数据的产生、采集、计算、存储、消费端到端的角度介绍大数据技术的起源、发展、关键技术点和未来趋势,结合生动的业界新产品,以及学术界新的研究方向和成果,让深奥的技术浅显易懂;第二部分从业务和技术角度介绍实际案例,让读者理解大数据的用途及技术的本质;第三部分介绍大数据技术不是孤立的,讲解如何与前沿的云技术、深度学习、机器学习等相结合。

    作者简介

    朱洁,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。

    罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200+电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。

    本书结构

    第一部分:第1~3章,主要讲述大数据的本质、运营商大数据的架构和一些基本的业务知识。

    第1章:阐述大数据的本质和面临的挑战。

    第2章:概述大数据架构及背后的驱动因素,以及未来发展的趋势。

    第3章:介绍运营商领域的业务,让读者对大数据能做什么有一个直观的感受。

    第二部分:第4~11章,围绕大数据平台技术栈来阐述数据获取、处理、分析和应用平台涉及的技术。

    第4章:介绍数据获取涉及的探针、爬虫、日志采集、数据分发中间件等技术。

    第5章:介绍流式数据处理引擎、CEP、流式应用。

    第6章:介绍交互式分析技术、MPP DB、热门的SQL on Hadoop技术。

    第7章:介绍批处理技术、Spark,以及大规模机器学习的BSP技术等。

    第8章:探讨机器学习、深度学习相关技术。

    第9章:统一资源管理是趋势,本章介绍资源管理的核心技术和算法。

    第10章:存储是基础,本章介绍存储的关键技术。

    第11章:探讨大数据技术怎么云化,以及关键技术是什么。

    第三部分:第12章,技术和文化息息相关,技术影响文化,文化影响技术。

    第12章:介绍大数据开发文化、开源、DevOps,探讨理念和文化对技术的冲击。

    大数据简史

    大数据(Big Data)现在可以说是人尽皆知,其实真正回溯起来,其是由SGI的首席科学家JohnRMasey于1998年在USENIX大会上首次提出的。他在其发表的一篇名为Big Data and the Next Wave of Infrastress"的论文中首次提出这个词,用来描述数据爆炸的现象。估计他当时未必能想到十几年后Big Data能这么火。

    如果追溯大数据的概念,则是阿尔文·托夫勒(Alvin Toffler)于1980年在《第三次浪潮》一书中预言了信息时代的到来会带来数据爆发,所以科学家很早就预见到了大数据。大数据的历史由来已久,但是技术需要持续积累,才能由量变到质变

    对于工业界来说,不得不提Google在2003-2006年公布的关于GFS、MapReduce和BigTable的三篇技术论文,正是这三篇论文奠定了大数据发展的基石。Hadoop之父-Doug Cutting正是参考论文,后来才实现了当前鼎鼎大名的Hadoop,而Hadoop的诞生极大地促进了大数据技术的蓬勃发展。

    当然,这里特别要指出,Hadoop并不等同于大数据,大数据也并不特指Hadoop,大数据只是一门市场语言,代表的是一种理念、一种问题解决思路、一系列技术的集合,Hadoop只是其中一种具体的处理数据的框架技术。

    大数据架构详解豆瓣截图

您现在查看是摘要介绍页, 详见PDF附件(132017KB,374页)