Spark已经成为数据科学专业人士最有前途的大数据分析引擎。Apache Spark真正的力量和价值在于它能够以高速和准确的方式执行数据科学任务;Spark的卖点是它结合ETL,批处理分析,实时流分析,机器学习,图形处理和可视化;它允许您轻松处理非结构化的原始数据集。
本书将让您舒适和自信地使用Spark完成数据科学任务。通过本书,您将了解如何实现包括分布式深度学习,数值计算和可扩展的机器学习任务。您将使用Spark的数据科学库(如MLLib,Pandas,NumPy,SciPy等)来解决数据科学的问题。这些简单有效的技巧将向您展示如何实施算法和优化您的工作。
Apache Spark for Data Science Cookbook图书由Padma Priya Chitturi所著,全书共358页;Packt Publishing出版社于2016年12月出版。
本书的章节
Chapter 1: Big Data Analytics with Spark Chapter 2: Tricky Statistics with Spark Chapter 3: Data Analysis with Spark Chapter 4: Clustering, Classification, and Regression Chapter 5: Working with Spark MLlib Chapter 6: NLP with Spark Chapter 7: Working with Sparkling Water - H2O Chapter 8: Data Visualization with Spark Chapter 9: Deep Learning on Spark Chapter 10: Working with SparkR
下载地址
关注本微信公众号iteblog_hadoop
并回复spark_cookbook
获取本书的下载地址。或
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【[电子书]Apache Spark for Data Science Cookbook PDF下载】(https://www.iteblog.com/archives/1994.html)