通过使用易于理解的实例,本书将教你如何使用Spark Streaming构建实时应用程序。从安装和设置所需的环境开始,您将编写并执行第一个程序Spark Streaming。接下来将探讨Spark Streaming的架构和组件以及概述Spark公开的库/函数的。接下来,您将通过处理分布式日志文件的用例来了解有关Spark中的各种客户端API编码。然后,您将学习到各种转换功能以及丰富流数据源接口。您将了解如何缓存和保留数据集。紧接着,你将学习到如何把Apache Spark与各种其他库/组件(如Mlib,GraphX和Spark SQL)进行集成。最后,您将了解如何部署应用程序,涵盖了从独立模式到使用Mesos,Yarn和私有数据中心或云基础架构的分布式模式等不同情况。
Learning Real-time Processing with Spark Streaming图书由Sumit Gupta所著,全书共202页;Packt Publishing出版社于2015年09月出版。
本书的章节
Chapter 1: Installing and Confi guring Spark and Spark Streaming Chapter 2: Architecture and Components of Spark and Spark Streaming Chapter 3: Processing Distributed Log Files in Real Time Chapter 4: Applying Transformations to Streaming Data Chapter 5: Persisting Log Analysis Data Chapter 6: Integration with Advanced Spark Libraries Chapter 7: Deploying in Production
下载地址
关注本微信公众号iteblog_hadoop
并回复learning_spark_streaming
获取本书的下载地址。或
点击进入下载
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【[电子书]Learning Real-time Processing with Spark Streaming PDF下载】(https://www.iteblog.com/archives/1942.html)