六月 – 2015 – 过往记忆

Spark Python API函数学习：pyspark API(2)

　　《Spark Python API函数学习：pyspark API(1)》　　《Spark Python API函数学习：pyspark API(2)》　　《Spark Python API函数学习：pyspark API(3)》　　《Spark Python API函数学习：pyspark API(4)》　　Spark支持Scala、Java以及Python语言，本文将通过图片和简单例子来学习pyspark API。.wp-caption img{ max-width: 100%; height: auto;}如果想

w397090770 10年前 (2015-06-28) 18940℃ 1评论16喜欢

Python

Spark Python API函数学习：pyspark API(1)

　　《Spark Python API函数学习：pyspark API(1)》　　《Spark Python API函数学习：pyspark API(2)》　　《Spark Python API函数学习：pyspark API(3)》　　《Spark Python API函数学习：pyspark API(4)》　　Spark支持Scala、Java以及Python语言，本文将通过图片和简单例子来学习pyspark API。.wp-caption img{ max-width: 100%; height: auto;}如果想

w397090770 10年前 (2015-06-28) 36729℃ 0评论78喜欢

Spark

SPARK SUMMIT 2015会议PPT百度网盘免费下载(1)

　　SPARK SUMMIT 2015会议于美国时间2015年06月15日到2015年06月17日在San Francisco（旧金山）进行，目前PPT已经全部公布了，不过很遗憾的是这个网站被墙了，无法直接访问，本博客将这些PPT全部整理免费下载。由于源网站限制，一天只能只能下载20个PPT，所以我只能一天分享20篇。如果想获取全部的PPT，请关站本博客。会议主旨　　T

w397090770 10年前 (2015-06-26) 4329℃ 0评论6喜欢

Spark

Spark on yarn上遇到的问题

　　最近在Yarn上使用Spark，不管是yarn-cluster模式还是yarn-client模式，都出现了以下的异常：[code lang="java"]Application application_1434099279301_123706 failed 2 times due to AM Container for appattempt_1434099279301_123706_000002 exited with exitCode: 127 due to: Exception from container-launch:org.apache.hadoop.util.Shell$ExitCodeException:at org.apache.hadoop.util.Shell.runCommand(Shell.java:464)

w397090770 10年前 (2015-06-19) 7874℃ 0评论3喜欢

Spark

Spark北京Meetup第八次活动

一、活动时间　　北京第八次Spark Meetup活动将于2015年06月27日进行；下午14：00-18：00。二、活动地点　　海淀区海淀大街1号中关村梦想实验室（原中关村国际数字设计中心）4层三、活动内容　　1、基于mesos和docker的spark实践 -- 马越数人科技大数据核心开发工程师　　2、Spark 1.4.0 新特性介绍 -- 朱诗雄 Databricks新晋

w397090770 10年前 (2015-06-17) 3091℃ 2评论2喜欢

Spark

Apache Spark 1.4.0新特性详解

　　今天早上我在博文里面更新了Spark 1.4.0正式发布，由于时间比较匆忙（要上班啊），所以在那篇文章里面只是简单地介绍了一下Spark 1.4.0，本文详细将详细地介绍Spark 1.4.0特性。如果你想尽早了解Spark等相关大数据消息，请关注本博客，或者本博客微信公共帐号iteblog_hadoop。　　Apache Spark 1.4.0版本于美国时间2015年06月11日正式发

w397090770 10年前 (2015-06-12) 5067℃ 1评论1喜欢

Spark

Apache Spark 1.4.0正式发布

　　早上时间匆忙，我将于晚点时间详细地介绍Spark 1.4的更新，请关注本博客。　　Apache Spark 1.4.0的新特性可以看这里《Apache Spark 1.4.0新特性详解》。　　Apache Spark 1.4.0于美国时间的2015年6月11日正式发布。Python 3支持，R API，window functions，ORC，DataFrame的统计分析功能，更好的执行解析界面，再加上机器学习管道从alpha毕业成

w397090770 10年前 (2015-06-12) 4732℃ 0评论11喜欢

Spark

Spark官方正式宣布支持SparkR(R on Spark)

　　我（不是博主，这里的我指的是Shivaram Venkataraman）很高兴地宣布即将发布的Apache Spark 1.4 release将包含SparkR，它是一个R语言包，允许数据科学家通过R shell来分析大规模数据集以及交互式地运行Jobs。　　R语言是一个非常流行的统计编程语言，并且支持很多扩展以便支持数据处理和机器学习任务。然而，R中交互式地数据分析常

w397090770 10年前 (2015-06-10) 8245℃ 0评论12喜欢

Spark

Spark 1.4中REST API介绍

　　在Spark 1.4中引入了REST API，这样我们可以像Hadoop中REST API一样，很方便地获取一些信息。这个ISSUE在https://issues.apache.org/jira/browse/SPARK-3644里面首先被提出，已经在Spark 1.4加入。　　Spark的REST API返回的信息是JSON格式的，开发者们可以很方便地通过这个API来创建可视化的Spark监控工具。目前这个API支持正在运行的应用程序，也支持

w397090770 10年前 (2015-06-10) 15812℃ 0评论8喜欢

Spark

SparkR(R on Spark)编程指南

概论　　SparkR是一个R语言包，它提供了轻量级的方式使得可以在R语言中使用Apache Spark。在Spark 1.4中，SparkR实现了分布式的data frame，支持类似查询、过滤以及聚合的操作（类似于R中的data frames：dplyr)，但是这个可以操作大规模的数据集。SparkR DataFrames　　DataFrame是数据组织成一个带有列名称的分布式数据集。在概念上和关系

w397090770 10年前 (2015-06-09) 36625℃ 1评论50喜欢

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

2015年06月的内容

Spark Python API函数学习：pyspark API(2)

Spark Python API函数学习：pyspark API(1)

SPARK SUMMIT 2015会议PPT百度网盘免费下载(1)

Spark on yarn上遇到的问题

Spark北京Meetup第八次活动

Apache Spark 1.4.0新特性详解

Apache Spark 1.4.0正式发布

Spark官方正式宣布支持SparkR(R on Spark)

Spark 1.4中REST API介绍

SparkR(R on Spark)编程指南