最新发布第103页

过往记忆专注于大数据技术构架及应用，微信公众号:过往记忆大数据

最热排行榜

浏览 (139525)481喜欢
1Hive数据类型转换
浏览 (116220)90喜欢
2Hive常用字符串函数
浏览 (102295)70喜欢
3Hive insert into语句用法
浏览 (94051)183喜欢
4Hive常用函数大全一览
浏览 (92750)132喜欢
5Hive几种数据导入方式
浏览 (91086)78喜欢
6Apache Spark SQL自适应执行实践
浏览 (88052)297喜欢
7精心收集的Hadoop学习资料(持续更新)
浏览 (84870)72喜欢
8使用HttpClient通过post方式发送json数据
浏览 (84155)76喜欢
9Hive:ORC File Format存储格式详解
浏览 (83965)91喜欢
10Spark: sortBy和sortByKey函数详解

WordPress自定义字段的操作

　　WordPress 的自定义字段就是文章的meta 信息（元信息），利用这个功能，可以扩展文章的功能，是学习WordPress 插件开发和主题深度开发的必备。对自定义字段的操作主要有四种：添加、更新(修改)、删除、获取(值)。　　1、首先自定义字段的添加函数，改函数可以为文章往数据库中添加一个字段：[code lang="php"]<?php add_

w397090770 10年前 (2015-04-30) 3539℃ 0评论8喜欢

Spark

　　《Spark Streaming作业提交源码分析接收数据篇》、《Spark Streaming作业提交源码分析数据处理篇》　　在昨天的文章中介绍了Spark Streaming作业提交的数据接收部分的源码（《Spark Streaming作业提交源码分析接收数据篇》），今天来介绍Spark Streaming中如何处理这些从外部接收到的数据。　　在调用StreamingContext的start函数的时候，

w397090770 10年前 (2015-04-29) 4407℃ 2评论9喜欢

Spark

Spark Streaming作业提交源码分析接收数据篇

　　《Spark Streaming作业提交源码分析接收数据篇》、《Spark Streaming作业提交源码分析数据处理篇》　　最近一段时间在使用Spark Streaming，里面遇到很多问题，只知道参照官方文档写，不理解其中的原理，于是抽了一点时间研究了一下Spark Streaming作业提交的全过程，包括从外部数据源接收数据，分块，拆分Job，提交作业全过程。

w397090770 10年前 (2015-04-28) 9204℃ 2评论9喜欢

Spark

OpenCloud 2015大会PPT资料免费下载[Spark篇]

　　由CSDN主办OpenCloud 2015大会于4月16日-18日在国家会议中心成功举办。“2015 OpenStack技术大会”、“2015 Spark技术峰会”、“2015 Container技术峰会”三大峰会及三场深度行业实战培训赢得了讲师和听众们高度认可，40余位一线专家的深度主题演讲赢得阵阵掌声。　　2015 spark技术峰会.pushed{color:#f60;}时间议题演讲者09:

w397090770 10年前 (2015-04-28) 7576℃ 0评论2喜欢

Spark

Spark Streaming性能调优详解

　　Spark Streaming提供了高效便捷的流式处理模式，但是在有些场景下，使用默认的配置达不到最优，甚至无法实时处理来自外部的数据，这时候我们就需要对默认的配置进行相关的修改。由于现实中场景和数据量不一样，所以我们无法设置一些通用的配置（要不然Spark Streaming开发者就不会弄那么多参数，直接写死不得了），我们需

w397090770 10年前 (2015-04-27) 26996℃ 0评论34喜欢

Hive

深入浅出Hive视频教程百度网盘免费下载

　　本博客分享的其他视频下载地址：《传智播客Hadoop实战视频下载地址[共14集]》、《传智播客Hadoop课程视频资料[共七天]》、《Hadoop入门视频分享[共44集]》、《Hadoop大数据零基础实战培训教程下载》、《Hadoop2.x 深入浅出企业级应用实战视频下载》、《Hadoop新手入门视频百度网盘下载[全十集]》　　本博客收集到的Hadoop学习书

w397090770 10年前 (2015-04-25) 37518℃ 8评论55喜欢

Hadoop

Hadoop 2.7.0发布：不适用于生产和不支持JDK1.6

　　Apache Hadoop 2.7.0发布。一共修复了来自社区的535个JIRAs，其中：Hadoop Common有160个；HDFS有192个；YARN有148个；MapReduce有35个。Hadoop 2.7.0是2015年第一个Hadoop release版本，不过需要注意的是　　（1）、不要将Hadoop 2.7.0用于生产环境，因为一些关键Bug还在测试中，如果需要在生产环境使用，需要等Hadoop 2.7.1/2.7.2，这些版本很快会发布。

w397090770 10年前 (2015-04-24) 8849℃ 0评论14喜欢

Spark

在Spark中自定义Kryo序列化输入输出API

　　在Spark中内置支持两种系列化格式：（1）、Java serialization；（2）、Kryo serialization。在默认情况下，Spark使用的是Java的ObjectOutputStream系列化框架，它支持所有继承java.io.Serializable的类系列化，虽然Java系列化非常灵活，但是它的性能不佳。然而我们可以使用Kryo 库来系列化，它相比Java serialization系列化高效，速度很快（通常比Java快1

w397090770 10年前 (2015-04-23) 14800℃ 0评论15喜欢

Memsql

使用Spark和MemSQL Spark连接器运行实时应用

　　Apache Spark是目前非常强大的分布式计算框架。其简单易懂的计算框架使得我们很容易理解。虽然Spark是在操作大数据集上很有优势，但是它仍然需要将数据持久化存储，HDFS是最通用的选择，和Spark结合使用，因为它基于磁盘的特点，导致在实时应用程序中会影响性能（比如在Spark Streaming计算中）。而且Spark内置就不支持事务提交(

w397090770 10年前 (2015-04-22) 10213℃ 0评论8喜欢

Kafka

Spark Streaming和Kafka整合开发指南(二)

　　《Spark Streaming和Kafka整合开发指南(一)》　　《Spark Streaming和Kafka整合开发指南(二)》　　在本博客的《Spark Streaming和Kafka整合开发指南(一)》文章中介绍了如何使用基于Receiver的方法使用Spark Streaming从Kafka中接收数据。本文将介绍如何使用Spark 1.3.0引入的Direct API从Kafka中读数据。　　和基于Receiver接收数据不一样，这种方式

w397090770 10年前 (2015-04-21) 28426℃ 1评论26喜欢

上一页
1
···
98
99
100
101
102
103
104
105
106
107
108
...
139
下一页
共 139 页