最新发布第68页

过往记忆专注于大数据技术构架及应用，微信公众号:过往记忆大数据

最热排行榜

浏览 (139219)474喜欢
1Hive数据类型转换
浏览 (115726)87喜欢
2Hive常用字符串函数
浏览 (102011)66喜欢
3Hive insert into语句用法
浏览 (92972)179喜欢
4Hive常用函数大全一览
浏览 (92445)128喜欢
5Hive几种数据导入方式
浏览 (90883)75喜欢
6Apache Spark SQL自适应执行实践
浏览 (87845)294喜欢
7精心收集的Hadoop学习资料(持续更新)
浏览 (84662)69喜欢
8使用HttpClient通过post方式发送json数据
浏览 (83720)73喜欢
9Hive:ORC File Format存储格式详解
浏览 (83660)88喜欢
10Spark: sortBy和sortByKey函数详解

通过Hive将数据写入到ElasticSearch

　　我在《使用Hive读取ElasticSearch中的数据》文章中介绍了如何使用Hive读取ElasticSearch中的数据，本文将接着上文继续介绍如何使用Hive将数据写入到ElasticSearch中。在使用前同样需要加入 elasticsearch-hadoop-2.3.4.jar 依赖，具体请参见前文介绍。我们先在Hive里面建个名为iteblog的表，如下：[code lang="sql"]CREATE EXTERNAL TABLE iteblog ( id b

w397090770 8年前 (2016-11-07) 19893℃ 1评论24喜欢

Spark

Spark Summit 2016 Europe全部PPT下载[共75个]

　　Spark Summit 2016 Europe会议于2016年10月25日至10月27日在布鲁塞尔进行。本次会议有上百位Speaker，来自业界顶级的公司。官方日程：https://spark-summit.org/eu-2016/schedule/。　　由于会议的全部资料存储在http://www.slideshare.net网站，此网站需要翻墙才能访问。基于此本站收集了本次会议的所有PPT资料供大家学习交流之用。本次会议PPT资料

w397090770 8年前 (2016-11-06) 3050℃ 0评论1喜欢

资料分享

2016中国架构师大会大数据专场PPT下载

2016中国架构师大会大数据专场于10月27日在京进行，大数据专场有来自搜狐、优酷介绍其视频个性化推荐架构设计；也有来自饿了么的实时架构演变；有来自Qunar、宜信以及广发证券再金融中应用大数据的架构设计；也有华为CarbonData的介绍，干货十足！值得一看。主要涉及如下主题： 10月27

w397090770 8年前 (2016-11-03) 4675℃ 0评论9喜欢

Flink

[电子书]Introduction to Apache Flink PDF下载

　　这本书是市面上第一本系统介绍Apache Flink的图书，书中介绍了为什么选择Apache Flink、流系统架构设计、Flink能做些什么、Flink中是怎么处理时间的、Flink的状态计算等。全书共6章，一共110页。由O'Reilly出版社于2016年10月出版。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop本书的章节[c

w397090770 8年前 (2016-11-03) 7856℃ 0评论4喜欢

Hadoop

运行Hbase作业出现cannot access its superclass com.google.protobuf.LiteralByteString异常解决

最近写了一个Spark程序用来读取Hbase中的数据，我的Spark版本是1.6.1，Hbase版本是0.96.2-hadoop2，当程序写完之后，使用下面命令提交作业：[code lang="java"][iteblog@www.iteblog.com $] bin/spark-submit --master yarn-cluster --executor-memory 4g --num-executors 5 --queue iteblog --executor-cores 2 --class com.iteblog.hbase.HBaseRead --jars spark-hbase-connector_2.10-1.0.3.jar,hbase-common-0.9

w397090770 8年前 (2016-11-03) 3616℃ 0评论7喜欢

ElasticSearch

Elasticsearch 5.0.0版本新特性介绍

　　Elasticsearch 5.0.0在2016年10月26日发布，该版本基于Lucene 6.2.0，这是最新的稳定版本，并且已经在Elastic Cloud上完成了部署。Elasticsearch 5.0.0是目前最快、最安全、最具弹性、最易用的版本，此版本带来了一系列的新功能和性能优化。ElasticSearch 5.0.0 release Note点击下载ElasticSearch 5.0.0阅读最新文档如果想及时了解Spark、Hadoop或者Hbase

w397090770 8年前 (2016-11-02) 4941℃ 0评论10喜欢

Kafka

在Spring中使用Kafka：Producer篇

　　在某些情况下，我们可能会在Spring中将一些WEB上的信息发送到Kafka中，这时候我们就需要在Spring中编写Producer相关的代码了；不过高兴的是，Spring本身提供了操作Kafka的相关类库，我们可以直接通过xml文件配置然后直接在后端的代码中使用Kafka，非常地方便。本文将介绍如果在Spring中将消息发送到Kafka。在这之前，请将下面的依赖

w397090770 8年前 (2016-11-01) 6222℃ 0评论11喜欢

ElasticSearch

使用Hive读取ElasticSearch中的数据

　　本文将介绍如何通过Hive来读取ElasticSearch中的数据，然后我们可以像操作其他正常Hive表一样，使用Hive来直接操作ElasticSearch中的数据，将极大的方便开发人员。本文使用的各组件版本分别为 Hive0.12、Hadoop-2.2.0、ElasticSearch 2.3.4。　　我们先来看看ElasticSearch中相关表的mapping：[code lang="bash"]{ "user": { "propert

w397090770 8年前 (2016-10-26) 17093℃ 0评论29喜欢

Spark

[电子书]Spark for Data Science PDF下载

　　昨天分享了《[电子书]Apache Spark 2 for Beginners pdf下载》，这本书很适合入门学习Spark，虽然书名上写着是Apache Spark 2，但是其内容介绍几乎和Spark 2毫无关系，今天要分享的图书也是一本适合入门的Spark电子书，也是Packt出版，2016年09月开始发行的，全书共339页，其面向读者是数据科学家，本书内容涵盖了Spark编程模型、DataFrame介绍

w397090770 8年前 (2016-10-24) 5061℃ 0评论13喜欢

Spark

[电子书]Apache Spark 2 for Beginners pdf下载

　　本书由Packt出版，2016年10月发行，全书共332页。从标题可以看出这本书是适用于初学者的，全书的例子有Scala和Python两个版本，涵盖了Spark基础、编程模型、SQL、Streaming、机器学习以及图计算等知识。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop本书的章节如下：[code lang="bash"]Chapter 1:

w397090770 8年前 (2016-10-24) 5879℃ 0评论8喜欢

上一页
1
···
63
64
65
66
67
68
69
70
71
72
73
...
139
下一页
共 139 页