这是一份迟来的年终报告,本来昨天就要发出来的,实在是没忙开,今天我就把它当作新年礼物送给各位看官,以下文章都是我结合日常工作、学习,每当“夜深人静"的时候写出来的一些小总结,希望能给大家一些技术上的帮助。
关注我的朋友都知道,我在今年八月份发了一篇文章,里面整理了我五年来写在这个公众号上面的原创文章。这篇文章几乎可以当作一份资料集,这里再把它放出来,需要的可以收藏一下五年总结:过往记忆大数据原创精选(点击进入)
(点击标题可直达对应文章,这只是我分享的一部分,完整版欢迎访问我的博客:https://www.iteblog.com/)
- 盘点2019年晋升为Apache TLP以及进去Apache孵化器的大数据相关项目
- Apache Kafka 2.4 正式发布,重要功能详细介绍
- Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比
- 60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践
- Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎
- Apache Spark 中编写可伸缩代码的4个技巧
- Apache Hudi: Uber 开源的大数据增量处理框架
- 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)的使用
- Apache Spark 3.0 预览版正式发布,多项重大功能发布
- 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)
- 使用 Spark 和 Delta Lake 构建近实时数据仓库
- Spark+AI Summit Europe 2019 超清视频&PPT下载
- Apache Cassandra 在 Facebook 的应用
- 重磅|Spark Delta Lake 现在由Linux基金会托管,将成为数据湖的开放标准
- Spark Delta Lake 0.4.0 发布,支持 Python API 和部分 SQL
- 一文了解 Apache Cassandra 是什么
- 云栖大会 | Apache Spark 3.0 和 Koalas 最新进展
- 原创干货 | 史上最全的大数据学习资源(Awesome Big Data)
- Apache Spark Delta Lake 写数据使用及实现原理代码解析
- 如何为Kafka集群选择合适的Topics/Partitions数量
- 你还在使用 JDK 7?JDK 13 都已经来了!五大新特性你最喜欢哪个 ?
- 32 道常见的 Kafka 面试题你都会吗?附答案
- 这可能是学习 Spark Delta Lake 最全的资料
- 深入理解 Apache Spark Delta Lake 的事务日志
- MongoDB 4.2 发布,支持分布式事务
- 一文理解 Apache Spark DataSource V2 诞生背景及入门实战
- 图文了解 Kafka 的副本复制机制
- 深入理解 Spark SQL 查询引擎
- Spark & Alluxio在网易严选架构演进中的实践和探索
- 重磅 | HPE 宣布收购 MapR!
- Uber 大数据平台的演进(2014~2019)
- Apache Hadoop 的 HDFS federation 前世今生
- Apache Hive JdbcStorageHandler 编程入门指南
- 深入理解 Spark Delta Lake 的诞生及其工作原理
- Spark-SQL 在字节跳动的应用实践
- Apache Kafka 2.3 发布,新特性讲解
- 砖厂 CEO Ali 对 Hadoop 的最新评价
- Apache Hive 联邦查询(Query Federation)
- Hadoop 气数已尽?
- 一条 SQL 在 Apache Spark 之旅(下)
- 一条 SQL 在 Apache Spark 之旅(中)
- 一条 SQL 在 Apache Spark 之旅(上)
- Kafka 是如何保证数据可靠性和一致性
- 深入理解 Spark SQL 查询引擎
- 通过 Spark Streaming Listener 监控程序
- 图文了解 Kafka 的副本复制机制
- 分布式原理:一致性哈希算法简介
- Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的
- Koalas: 让 pandas 开发者轻松过渡到 Apache Spark
- .NET for Apache Spark 预览版正式发布
- 重磅 | Apache Spark 社区期待的 Delta Lake 开源了
- Flink Forward 201904 PPT资料下载
- Apache Spark 2.4 回顾以及 3.0 展望
- SHC:使用 Spark SQL 高效地读写 HBase
- Apache Spark 未来:Spark 3.0 预览
- Open Distro for Elasticsearch:AWS 自家版本的开源 ElasticSearch
- Apache Spark 3.0 将内置支持 GPU 调度
- HBase 中加盐之后的表如何读取:Spark 篇
- HBase 中加盐之后的表如何读取:协处理器篇
- HBase 协处理器入门及实战
- 分布式原理:一致性哈希算法简介
- 分布式原理:一文了解 Gossip 协议
- Kafka创建Topic时如何将分区放置到不同的Broker中
- HBase 入门之数据刷写(Memstore Flush)详细说明
- Apache Arrow:一个跨平台的内存数据交换格式
- 为什么不建议在 HBase 中使用过多的列族
- 为了让你更全面的了解Apache HBase,我们做了这本专刊
- {Submarine} 在 Apache Hadoop 中运行深度学习框架
- 盘点2018年晋升为Apache TLP的大数据相关项目
2020年,希望继续得到大家的支持,同时祝大家2020年幸福快乐,升职加薪,出任CEO,迎娶白富美,走上人生巅峰!!
本博客文章除特别声明,全部都是原创!原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【过往记忆大数据,2019年原创精选69篇】(https://www.iteblog.com/archives/9748.html)