最新发布第117页

过往记忆专注于大数据技术构架及应用，微信公众号:过往记忆大数据

最热排行榜

浏览 (139555)481喜欢
1Hive数据类型转换
浏览 (116271)90喜欢
2Hive常用字符串函数
浏览 (102319)70喜欢
3Hive insert into语句用法
浏览 (94132)183喜欢
4Hive常用函数大全一览
浏览 (92771)132喜欢
5Hive几种数据导入方式
浏览 (91098)78喜欢
6Apache Spark SQL自适应执行实践
浏览 (88084)297喜欢
7精心收集的Hadoop学习资料(持续更新)
浏览 (84885)72喜欢
8使用HttpClient通过post方式发送json数据
浏览 (84199)76喜欢
9Hive:ORC File Format存储格式详解
浏览 (84006)91喜欢
10Spark: sortBy和sortByKey函数详解

Spark1.1.0预览文档(Spark Overview)

　　Apache Spark是快速的通用集群计算系统。它在Java、Scala以及Python等语言提供了高层次的API，并且在通用的图形计算方面提供了一个优化的引擎。同时，它也提供了丰富的高层次工具，这些工具包括了Spark SQL、结构化数据处理、机器学习工具(MLlib)、图形计算(GraphX)以及Spark Streaming。如果想及时了解Spark、Hadoop或者Hbase相关的文章，

w397090770 11年前 (2014-09-18) 3607℃ 0评论6喜欢

网站建设

《过往记忆》博客公告：邮箱系统正常啦

　　首先，很感谢大家对本博客的支持。　　在此我想给各位网友阐述两件事（1）、QQ群问题；（2）、网站无法注册问题。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop一、QQ群问题（定期清人）　　我在今年五月份创建了一个QQ群（群号：138615359），用来讨论Hadoop、Spark等相关方面

w397090770 11年前 (2014-09-17) 3895℃ 4评论8喜欢

Hive

用Maven编译Spark 1.1.0

　　Spark 1.1.0已经在前几天发布了（《Spark 1.1.0发布:各个模块得到全面升级》、《Spark 1.1.0正式发布》），本博客对Hive部分进行了部分说明：《Spark SQL 1.1.0和Hive的兼容说明》、《Shark迁移到Spark 1.1.0 编程指南》，在这个版本对Hive的支持更加完善了，如果想在Spark SQL中加入Hive，并加入JDBC server和CLI，我们可以在编译的时候通过加上参

w397090770 11年前 (2014-09-17) 18511℃ 8评论10喜欢

Hadoop

Hadoop2.x 深入浅出企业级应用实战视频下载

　　本博客分享的其他视频下载地址：《传智播客Hadoop实战视频下载地址[共14集]》、《传智播客Hadoop课程视频资料[共七天]》、《Hadoop入门视频分享[共44集]》、《Hadoop大数据零基础实战培训教程下载》、《Hadoop2.x 深入浅出企业级应用实战视频下载》、《Hadoop新手入门视频百度网盘下载[全十集]》　　本博客收集到的Hadoop学习书

w397090770 11年前 (2014-09-16) 119846℃ 4评论290喜欢

Mahout

用Maven编译Mahout工程

一、前提条件　　1、安装好Java JDK 1.6或以上版本；　　2、安装好Apache Maven。　　如果上述条件准备好之后，下面开始用Maven编译Mahout源码二、git一份Mahout源码　　用下面的命令从 Mahout GitHub 仓库Git（如果你电脑没有安装Git软件，可以参照这个安装《Git安装》）一份代码到本地[code lang="JAVA"]git clone git@github.com:apache/mahout.git

w397090770 11年前 (2014-09-16) 6264℃ 0评论3喜欢

Hadoop

MapReduce：详细介绍Shuffle的执行过程

　　Shuffle过程是MapReduce的核心，也被称为奇迹发生的地方。要想理解MapReduce， Shuffle是必须要了解的。我看过很多相关的资料，但每次看完都云里雾里的绕着，很难理清大致的逻辑，反而越搅越混。前段时间在做MapReduce job 性能调优的工作，需要深入代码研究MapReduce的运行机制，这才对Shuffle探了个究竟。考虑到之前我在看相关资料

w397090770 11年前 (2014-09-15) 16416℃ 7评论59喜欢

Spark

Spark 1.1.0发布:各个模块得到全面升级

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop　　今天我很激动地宣布Spark 1.1.0发布了，Spark 1.1.0引入了许多新特征（new features）包括了可扩展性和稳定性方面的提升。这篇文章主要是介绍了Spark 1.1.0主要的特性，下面的介绍主要是根据各个特征重要性的优先级进行说明的。在接下来的两个星

w397090770 11年前 (2014-09-12) 4701℃ 2评论8喜欢

Spark

Spark 1.1.0正式发布

　　我们期待已久的Spark 1.1.0在美国时间的9月11日正式发布了，官方发布的声明如下：We are happy to announce the availability of Spark 1.1.0! Spark 1.1.0 is the second release on the API-compatible 1.X line. It is Spark’s largest release ever, with contributions from 171 developers!This release brings operational and performance improvements in Spark core including a new implementation of the Spark

w397090770 11年前 (2014-09-12) 3811℃ 0评论2喜欢

Hive

Spark SQL 1.1.0和Hive的兼容说明

　　Spark SQL也是可以直接部署在当前的Hive wareHouse。　　Spark SQL 1.1.0的 Thrift JDBC server 被设计成兼容当前的Hive数据仓库。你不需要修改你的Hive元数据，或者是改变表的数据存放目录以及分区。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop　　以下列出来的是当前Spark SQL（1.1.0）对Hive特性的

w397090770 11年前 (2014-09-11) 9429℃ 1评论8喜欢

Shark

Shark迁移到Spark 1.1.0 编程指南

　　Spark 1.1.0马上就要发布了（估计就是明天），其中更新了很多功能。其中对Spark SQL进行了增强：　　1、Spark 1.0是第一个预览版本( 1.0 was the first “preview” release)；　　2、Spark 1.1 将支持Shark更新(1.1 provides upgrade path for Shark)，　　　　（1）、Replaced Shark in our benchmarks with 2-3X perfgains；　　　　（2）、Can perform optimizations with 10-

w397090770 11年前 (2014-09-11) 7793℃ 2评论5喜欢

上一页
1
···
112
113
114
115
116
117
118
119
120
121
122
...
140
下一页
共 140 页