w397090770的文章

23种非常有用的ElasticSearch查询例子(6)

　　本系列文章将展示ElasticSearch中23种非常有用的查询使用方法。由于篇幅原因，本系列文章分为六篇，本文是此系列的第五篇文章。欢迎关注大数据技术博客微信公共账号:iteblog_hadoop。《23种非常有用的ElasticSearch查询例子(1)》《23种非常有用的ElasticSearch查询例子(2)》《23种非常有用的ElasticSearch查询例子(3)》《23种非常有用

8年前 (2016-10-02) 5900℃ 0评论3喜欢

Maven

如何发布Jar包到Maven中央仓库

　　本博客曾经介绍了《如何手动添加依赖的jar文件到本地Maven仓库》这里的方法非常的简单，而且局限性很大：只能提供给本人开发使用，无法共享给其他需要的人。本文将介绍如何把自己开发出来的Java包发布到Maven中央仓库(http://search.maven.org/)，这样任何人都可以搜索到这个包并使用它。如果你现在还不了解Maven是啥东西，请你

8年前 (2016-09-27) 9769℃ 2评论23喜欢

CarbonData

Apache CarbonData性能基准报告：查询性能秒杀Parquet

本文相关测试数据由华为陈亮大神提供，特别感谢。　　Apache CarbonData是由华为开发、开源并支持Apache Hadoop的列式存储文件格式，支持索引、压缩以及解编码等，其目的是为了实现同一份数据达到多种需求，而且能够实现更快的交互查询，目前该项目正处于Apache孵化过程中。详细介绍可以参见(《CarbonData：华为开发并支持Hadoop的

8年前 (2016-09-11) 8290℃ 1评论7喜欢

Kafka

如何为Kafka集群选择合适的Topics/Partitions数量？

　　这是许多kafka使用者经常会问到的一个问题。本文的目的是介绍与本问题相关的一些重要决策因素，并提供一些简单的计算公式。越多的分区可以提供更高的吞吐量　　首先我们需要明白以下事实：在kafka中，单个patition是kafka并行操作的最小单元。在producer和broker端，向每一个分区写入数据是可以完全并行化的，此时，可

8年前 (2016-09-08) 10307℃ 2评论22喜欢

ElasticSearch

23种非常有用的ElasticSearch查询例子(4)

　　本系列文章将展示ElasticSearch中23种非常有用的查询使用方法。由于篇幅原因，本系列文章分为六篇，本文是此系列的第四篇文章。欢迎关注大数据技术博客微信公共账号:iteblog_hadoop。《23种非常有用的ElasticSearch查询例子(1)》《23种非常有用的ElasticSearch查询例子(2)》《23种非常有用的ElasticSearch查询例子(3)》《23种非常有用

8年前 (2016-09-04) 7476℃ 0评论8喜欢

wordpress开发

如何替换WordPress登录页面的图标链接等

　　默认情况下，使用WordPress系统的博客登录页面都比较简单，登陆页面显示的logo是WordPress 的logo，链接也是WordPress的链接，如下图所示：如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop　　值得高兴的是，WordPress博客系统为我们提供了很多钩子(hook)来自定义这些信息，比如Logo、链接、提

8年前 (2016-09-03) 1917℃ 0评论6喜欢

Hadoop

四种常见的MapReduce设计模式

　　使用MapReduce解决任何问题之前，我们需要考虑如何设计。并不是任何时候都需要map和reduce job。MapReduce设计模式(MapReduce Design Pattern)整个MapReduce作业的阶段主要可以分为以下四种：　　1、Input-Map-Reduce-Output　　2、Input-Map-Output　　3、Input-Multiple Maps-Reduce-Output　　4、Input-Map-Combiner-Reduce-Output下面我将一一介绍哪种

8年前 (2016-09-01) 5756℃ 0评论16喜欢

Flume

Kafka实战：七步将RDBMS中的数据实时传输到Hadoop

　　对那些想快速把数据传输到其Hadoop集群的企业来说，Kafka是一个非常合适的选择。关于什么是Kafka我就不介绍了，大家可以参见我之前的博客：《Apache kafka入门篇:工作原理简介》　　本文是面向技术人员编写的。阅读本文你将了解到我是如何通过Kafka把关系数据库管理系统(RDBMS)中的数据实时写入到Hive中，这将使得实时分析的

8年前 (2016-08-30) 11509℃ 6评论26喜欢

ElasticSearch

ElasticSearch系列文章：安装

　　Elasticsearch最少需要Java 7版本，在本文写作时，推荐使用Oracle JDK 1.8.0_73版本。Java的安装和平台有关，所以本文并不打算介绍如何在各个平台上安装Java。在你安装ElasticSearch之前，先运行以下的命令检查你Java的版本：[code lang="java"]java -versionecho $JAVA_HOME[/code]　　一旦我们将 Java 安装完成，我们就可以下载并安装 Elasticsearch

8年前 (2016-08-29) 1539℃ 0评论1喜欢

ElasticSearch

ElasticSearch文档元数据(Metadata)

　　在Elasticsearch下，一个文档除了有数据之外，它还包含了元数据(Metadata)。每创建一条数据时，都会对元数据进行写入等操作，当然有些元数据是在创建mapping的时候就会设置，元数据在Elasticsearch下起到了非常大的作用。本文将对ElasticSearch中的元数据进行介绍，后续文章将分别对这些元数据进行解说。身份元数据(Identity meta-field

8年前 (2016-08-28) 4560℃ 0评论4喜欢

上一页
1
···
60
61
62
63
64
65
66
67
68
69
70
...
133
下一页
共 133 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

w397090770的文章

23种非常有用的ElasticSearch查询例子(6)

如何发布Jar包到Maven中央仓库

Apache CarbonData性能基准报告：查询性能秒杀Parquet

如何为Kafka集群选择合适的Topics/Partitions数量？

23种非常有用的ElasticSearch查询例子(4)

如何替换WordPress登录页面的图标链接等

四种常见的MapReduce设计模式

Kafka实战：七步将RDBMS中的数据实时传输到Hadoop

ElasticSearch系列文章：安装

ElasticSearch文档元数据(Metadata)