当前位置: 100md首页 > 电子书籍 > 资料下载2021 >
编号:52027
Spark大数据分析实战.pdf
http://www.100md.com 2019年12月24日
第1页
第9页
第11页
第21页
第36页

    参见附件(6756KB,438页)。

    Spark大数据分析实战本站提供,这是针对Spark大数据开发打造的实战书籍,里面从零开始详细讲解项目搭建,开发流程等等,帮助你快速上手Spark大数据!

    Spark大数据分析实战内容提要

    这是一本根据应用场景讲解如何通过Spark进行大数据分析与应用构建的著作,以实战为导向。作者结合典型应用场景,抽象出通用与简化后的模型,以便于读者能举一反三,直接应用。

    本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。在每个场景中,首先是对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法与应用,最后结合其他开源系统或工具构建更为丰富的数据分析流水线。

    Spark大数据分析实战作者信息

    高彦杰

    毕业于中国人民大学,就职于微软亚洲研究院。开源技术爱好者,对Spark及其他开源大数据系统与技术有较为深入的认识和研究,实践经验丰富。较早接触并使用Spark,对Spark应用开发、Spark系统的运维和测试比较熟悉,深度阅读了Spark的源代码,了解Spark的运行机制,擅长Spark的查询优化。

    曾著有畅销书《Spark大数据处理:技术、应用与性能优化》。

    倪亚宇

    清华大学自动化系在读博士研究生,曾于微软亚洲研究院、IBM研究院实习。对大规模的推荐系统和机器学习算法有较为深入的研究和丰富的实践经验。

    Spark大数据分析实战章节预览

    第1章Spark简介

    第2章Spark开发与环境配置

    第3章BDAS简介

    第4章Lamda架构日志分析流水线

    第5章基于云平台和用户日志的推荐系统

    第6章Twitter情感分析

    第7章热点新闻分析系统

    第8章构建分布式的协同过滤推荐系统

    第9章基于Spark的社交网络分析

    第10章基于Spark的大规模新闻

    第11章构建分布式的搜索引擎主题分析

    Spark大数据分析实战截图