标签：Kafka

大规模数据处理的演化历程(2003-2018)

本文翻译自《Streaming System》最后一章《The Evolution of Large-Scale Data Processing》，在探讨流式系统方面本书是市面上难得一见的深度书籍，非常值得学习。大数据如果从 Google 对外发布 MapReduce 论文算起，已经前后跨越十五年，我打算在本文和你蜻蜓点水般一起浏览下大数据的发展史，我们从最开始 MapReduce 计算模型开始，一路走马观

w397090770 7年前 (2018-10-08) 10397℃ 2评论27喜欢

Kafka

Spark 从 Kafka 读数并发问题

经常使用 Apache Spark 从 Kafka 读数的同学肯定会遇到这样的问题：某些 Spark 分区已经处理完数据了，另一部分分区还在处理数据，从而导致这个批次的作业总消耗时间变长；甚至导致 Spark 作业无法及时消费 Kafka 中的数据。为了简便起见，本文讨论的 Spark Direct 方式读取 Kafka 中的数据，这种情况下 Spark RDD 中分区和 Kafka 分区是一一对

w397090770 7年前 (2018-09-08) 6649℃ 0评论25喜欢

Kafka

Apache Kafka 2.0.0 正式发布，多项重要功能更新

Apache Kafka 2.0.0 在昨天正式发布了，其包含了许多重要的特性，这里我列举了一些比较重要的：如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公众号：iteblog_hadoop增加了前缀通配符访问控制(ACL)的支持，详见 KIP-290，这样我们可以更加细粒度的进行访问控制；更全面的数据安全支持，KIP-255 里面添加了一个框架，

w397090770 7年前 (2018-07-31) 3998℃ 0评论6喜欢

Kafka

Apache Kafka 协议中文编程指南

本文基于 A Guide To The Kafka Protocol 2017-06-14 的版本 v114 进行翻译的。简介本文档涵盖了 Kafka 0.8 及更高版本的通信协议实现。它旨在提供一个可读的，涵盖可请求的协议及其二进制格式，以及如何正确使用他们来实现一个客户端的协议指南。本文假设您已经了解了 Kafka 的基本设计以及术语。0.7 及更早的版本所使用的协议与此

w397090770 7年前 (2018-07-11) 4277℃ 1评论12喜欢

Kafka

Kafka 2.0.0 重磅发布，新特性独家解读

今天 Apache Kafka 项目的 2.0.0 版本正式发布了！距离 1.0 版本的发布，相距还不到一年。这一年不论是社区还是 Confluent 内部对于到底 Kafka 要向哪里发展都有很多讨论：从最初的标准消息系统，到现如今成为一个完整的包括导入导出和处理的流数据平台，从 0.8.2 一直到 1.0 版本，很多新特性和新部件被不断添加。但同时更重要的，关于

w397090770 7年前 (2018-06-28) 5298℃ 0评论6喜欢

Kafka

Spring Boot 中读写 Kafka header 信息

Apache Kafka 从 0.11.0.0 版本开始支持在消息中添加 header 信息，具体参见 KAFKA-4208。如果想及时了解Spark、Hadoop或者HBase相关的文章，欢迎关注微信公众号：iteblog_hadoop本文将介绍如何使用 spring-kafka 在 Kafka Message 中添加或者读取自定义 headers。本文使用各个系统的版本为：Spring Kafka: 2.1.4.RELEASESpring Boot: 2.0.0.RELEASEApache Kafka: kafka

w397090770 7年前 (2018-05-13) 4911℃ 0评论0喜欢

Kafka

[电子书]Building Data Streaming Applications with Apache Kafka PDF下载

本书于2017-08由 Packt 出版，作者 Manish Kumar, Chanchal Singh，全书269页。关注大数据猿(bigdata_ai)公众号及时获取最新大数据相关电子书、资讯等通过本书你将学到以下知识Learn the basics of Apache Kafka from scratchUse the basic building blocks of a streaming applicationDesign effective streaming applications with Kafka using Spark, Storm &, and HeronUnderstand the i

zz~~ 8年前 (2017-11-08) 6672℃ 0评论31喜欢

Kafka

重磅：Kafka 迎来 1.0.0 版本，正式告别四位数版本号！

Kafka 从首次发布之日起，已经走过了七个年头。从最开始的大规模消息系统，发展成为功能完善的分布式流式处理平台，用于发布和订阅、存储及实时地处理大规模流数据。来自世界各地的数千家公司在使用 Kafka，包括三分之一的 500 强公司。Kafka 以稳健的步伐向前迈进，首先加入了复制功能和无边界的键值数据存储，接着推出了用

w397090770 8年前 (2017-11-05) 25874℃ 0评论17喜欢

Kafka

在Kafka中使用Avro编码消息：Spark篇

在《在Kafka中使用Avro编码消息：Producter篇》和《在Kafka中使用Avro编码消息：Consumer篇》两篇文章里面我介绍了直接使用原生的 Kafka API生成和消费 Avro 类型的编码消息，本文将继续介绍如何通过 Spark 从 Kafka 中读取这些 Avro 格式化的消息。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop其

zz~~ 8年前 (2017-09-26) 4784℃ 0评论19喜欢

Kafka

在Kafka中使用Avro编码消息：Consumer篇

我在《在Kafka中使用Avro编码消息：Producter篇》文章中简单介绍了如何发送 Avro 类型的消息到 Kafka。本文接着上文介绍如何从 Kafka 读取 Avro 格式的消息。关于 Avro 我这就不再介绍了。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop从 Kafka 中读取 Avro 格式的消息从 Kafka 中读取 Avro 格式的消

w397090770 8年前 (2017-09-25) 6513℃ 0评论16喜欢

上一页
1
2
3
4
5
6
7
8
9
下一页
共 9 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

标签：Kafka

大规模数据处理的演化历程(2003-2018)

Spark 从 Kafka 读数并发问题

Apache Kafka 2.0.0 正式发布，多项重要功能更新

Apache Kafka 协议中文编程指南

Kafka 2.0.0 重磅发布，新特性独家解读

Spring Boot 中读写 Kafka header 信息

[电子书]Building Data Streaming Applications with Apache Kafka PDF下载

重磅：Kafka 迎来 1.0.0 版本，正式告别四位数版本号！

在Kafka中使用Avro编码消息：Spark篇

在Kafka中使用Avro编码消息：Consumer篇