最新发布第44页

过往记忆专注于大数据技术构架及应用，微信公众号:过往记忆大数据

最热排行榜

浏览 (139555)481喜欢
1Hive数据类型转换
浏览 (116271)90喜欢
2Hive常用字符串函数
浏览 (102319)70喜欢
3Hive insert into语句用法
浏览 (94132)183喜欢
4Hive常用函数大全一览
浏览 (92771)132喜欢
5Hive几种数据导入方式
浏览 (91098)78喜欢
6Apache Spark SQL自适应执行实践
浏览 (88084)297喜欢
7精心收集的Hadoop学习资料(持续更新)
浏览 (84885)72喜欢
8使用HttpClient通过post方式发送json数据
浏览 (84199)76喜欢
9Hive:ORC File Format存储格式详解
浏览 (84006)91喜欢
10Spark: sortBy和sortByKey函数详解

Spark 从 Kafka 读数并发问题

经常使用 Apache Spark 从 Kafka 读数的同学肯定会遇到这样的问题：某些 Spark 分区已经处理完数据了，另一部分分区还在处理数据，从而导致这个批次的作业总消耗时间变长；甚至导致 Spark 作业无法及时消费 Kafka 中的数据。为了简便起见，本文讨论的 Spark Direct 方式读取 Kafka 中的数据，这种情况下 Spark RDD 中分区和 Kafka 分区是一一对

w397090770 6年前 (2018-09-08) 6645℃ 0评论25喜欢

HBase

Apache HBase中等对象存储MOB压缩分区策略介绍

关于 HBase 的 MOB 具体使用可以参见《HBase MOB（Medium Object）使用入门指南》介绍Apache HBase 中等对象存储（Medium Object Storage, 下面简称 MOB）的特性是由 HBASE-11339 引入的。该功能可以提高 HBase 对中等尺寸文件的低延迟读写访问（理想情况下，文件大小为 100K 到 10MB），这个功能使得 HBase 非常适合存储文档，图片和其他中等尺寸的对

w397090770 7年前 (2018-08-27) 2400℃ 0评论2喜欢

Flink

Apache Flink状态管理和容错机制介绍

本文整理自8月11日在北京举行的 Flink Meetup 会议，分享嘉宾施晓罡，目前在阿里大数据团队部从事Blink方面的研发，现在主要负责Blink状态管理和容错相关技术的研发。本文由韩非（Flink China社区志愿者）整理一、有状态的流数据处理1、什么是有状态的计算计算任务的结果不仅仅依赖于输入，还依赖于它的当前状态，其实大

w397090770 7年前 (2018-08-24) 9126℃ 0评论21喜欢

Mysql

将 MySQL 的增量数据导入到 Apache Solr 中

在这篇和这篇文章中我分别介绍了如何将 MySQL 的全量数据导入到 Apache Solr 中以及如何分页导入等，本篇文章将继续介绍如何将 MySQL 的增量数据导入到 Solr 中。增量导数接口为 deltaimport，对应的页面如下：如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop如果我们使用《将 MySQL 的全量

w397090770 7年前 (2018-08-18) 1650℃ 0评论3喜欢

Flink

Apache Flink 在唯品会的实践

本文来自于王新春在2018年7月29日 Flink China社区线下 Meetup·上海站的分享。王新春目前在唯品会负责实时平台相关内容，主要包括实时计算框架和提供实时基础数据，以及机器学习平台的工作。之前在美团点评，也是负责大数据平台工作。他已经在大数据实时处理方向积累了丰富的工作经验。。本文主要内容如下：唯品会实时

zz~~ 7年前 (2018-08-15) 7259℃ 0评论14喜欢

Flink

基于 Flink 的实时特征平台在携程的应用

本文来自7月26日在上海举行的 Flink Meetup 会议，分享来自于刘康，目前在大数据平台部从事模型生命周期相关平台开发，现在主要负责基于flink开发实时模型特征计算平台。熟悉分布式计算，在模型部署及运维方面有丰富实战经验和深入的理解，对模型的算法及训练有一定的了解。本文主要内容如下：在公司实时特征开发的现

zz~~ 7年前 (2018-08-14) 7404℃ 0评论3喜欢

Flink

Flink China社区线下 Meetup·北京站 PPT 资料分享

Flink China社区线下 Meetup·北京站会议于 2018年8月11日在朝阳区酒仙桥北路恒通国际创新园进行。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop活动议程13:40-13:50 莫问出品人开场发言13:50-14:30 Flink Committer星罡《Flink状态管理和恢复技术介绍》，详细请见这里14:30-15:10 滴滴余海琳《Flink在

zz~~ 7年前 (2018-08-14) 2970℃ 0评论4喜欢

Flink

Flink China社区线下 Meetup·上海站 PPT 资料分享

Flink China社区线下 Meetup·上海站会议于 2018年7月29日在上海市杨浦区政学路77号INNOSPACE进行。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop活动议程14:00-14:10 大沙出品人开场发言14:10-14:40 阿里巴真《阿里在Flink的优化和改进分享》14:40-15:10 唯品会王新春《Flink在唯品会的实践》详细

w397090770 7年前 (2018-08-13) 2339℃ 0评论5喜欢

Flink

Apache Flink 1.6.0 正式发布，涵盖多项重要更新

为期两个月开发的 Apache Flink 1.6.0 于今天（2018-08-09）正式发布了。Flink 社区艰难地解决了 360 个 issues，到这里查看完整版的 changelog 。Flink 1.6.0 是 1.x.y 版本系列上的第七个版本，1.x.y 中所有使用 @Public 标注的 API 都是兼容的。此版本继续使 Flink 用户能够无缝地运行快速数据处理并轻松构建数据驱动和数据密集型应用程序。Apache Fli

w397090770 7年前 (2018-08-09) 1956℃ 0评论10喜欢

Mysql

将 MySQL 的全量数据以分页的形式导入到 Apache Solr 中

在《将 MySQL 的全量数据导入到 Apache Solr 中》文章中介绍了如何将 MySQL 中的全量数据导入到 Solr 中。里面提到一个问题，那就是如果数据量很大的时候，一次性导入数据可能会影响 MySQL ，这种情况下能不能分页导入呢？答案是肯定的，本文将介绍如何通过分页的方式将 MySQL 里面的数据导入到 Solr。分页导数的方法和全量导大部

w397090770 7年前 (2018-08-07) 1493℃ 0评论1喜欢

上一页
1
···
39
40
41
42
43
44
45
46
47
48
49
...
140
下一页
共 140 页