本书旨在通过教你如何扩展Spark的功能,将你对Spark的有限知识提升到一个新的水平。全书从Spark生态系统开始概述,您将学习如何使用MLlib创建一个完全的神经网络系统,然后您将了解如何调整流处理以获得最佳性能并确保并行处理。本书作者Mike Frampton,由Packt 于2015年09月出版,全书318页,通过本书你将学到以下知识:
(1)、扩展可用于处理和存储的工具;
(2)、使用MLlib来检查聚类和分类;
(3)、结合Flume和HDFS来学习Spark Streming;
(4)、学习Spark SQL;
(5)、使用 Spark GraphX学习图处理知识;
(6)、整合Spark、H20和机器学习
(7)、通过Apache Spark、Titan, HBase 和 Cassandra来评估图存储的工作原理;
(8)、在Databricks和AWS云系统上使用Apache Spark。
本书的章节
Chapter 1: Apache Spark Chapter 2: Apache Spark MLlib Chapter 3: Apache Spark Streaming Chapter 4: Apache Spark SQL Chapter 5: Apache Spark GraphX Chapter 6: Graph-based Storage Chapter 7: Extending Spark with H2O Chapter 8: Spark Databricks Chapter 9: Databricks Visualization
下载地址
关注本微信公众号iteblog_hadoop并回复 掌握spark 获取本书的下载地址。
点击进入下载本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【[电子书]Mastering Apache Spark下载】(https://www.iteblog.com/archives/1902.html)