标签：Flink

Tumbling Windows vs Sliding Windows区别与联系

　　在流系统中通常会经常使用到Windows来统计一定范围的数据，比如按照固定时间、按个数等统计。一般会存在两种类型的Windows：Tumbling Windows vs Sliding Windows，它们很容易被初学者混淆，那么Tumbling Windows vs Sliding Windows之间到底有啥区别与联系呢？这就是本文将要展开的。　　Tumbling的中文意思是摔跤，翻跟头，翻筋斗；Sliding中

w397090770 9年前 (2016-07-26) 3527℃ 0评论4喜欢

Flink

Apache Flink：Table API和SQL发展现状概述

Flink Table API　　Apache Flink对SQL的支持可以追溯到一年前发布的0.9.0-milestone1版本。此版本通过引入Table API来提供类似于SQL查询的功能，此功能可以操作分布式的数据集，并且可以自由地和Flink其他API进行组合。Tables在发布之初就支持静态的以及流式数据(也就是提供了DataSet和DataStream相关APIs)。我们可以将DataSet或DataStream转成Table；同

w397090770 9年前 (2016-06-16) 4267℃ 0评论5喜欢

Flink

Flink batch模式多路文件输出(MultipleTextOutputFormat)

　　昨天我提到了如何在《Flink Streaming中实现多路文件输出(MultipleTextOutputFormat)》，里面我们实现了一个MultipleTextOutputFormatSinkFunction类，其中封装了mutable.Map[String, TextOutputFormat[String]]，然后根据key的不一样选择不同的TextOutputFormat从而实现了文件的多路输出。本文将介绍如何在Flink batch模式下实现文件的多路输出，这种模式下比较简单

w397090770 9年前 (2016-05-11) 4096℃ 3评论6喜欢

Flink

Flink Streaming中实现多路文件输出(MultipleTextOutputFormat)

　　有时候我们需要根据记录的类别分别写到不同的文件中去，正如本博客的《Hadoop多文件输出：MultipleOutputFormat和MultipleOutputs深究(一)》《Hadoop多文件输出：MultipleOutputFormat和MultipleOutputs深究(二)》以及《Spark多文件输出(MultipleOutputFormat)》等文章提到的类似。那么如何在Flink Streaming实现类似于《Spark多文件输出(MultipleOutputFormat)》文

w397090770 9年前 (2016-05-10) 8330℃ 4评论7喜欢

Flink

使用Flink读取Kafka中的消息

　　本文将介绍如何通过Flink读取Kafka中Topic的数据。　　和Spark一样，Flink内置提供了读/写Kafka Topic的Kafka连接器(Kafka Connectors)。Flink Kafka Consumer和Flink的Checkpint机制进行了整合，以此提供了exactly-once处理语义。为了实现这个语义，Flink不仅仅依赖于追踪Kafka的消费者group偏移量，而且将这些偏移量存储在其内部用于追踪。　　和Sp

w397090770 9年前 (2016-05-03) 23983℃ 1评论23喜欢

Flink

Flink：本地执行(Local Execution)

　　Flink可以在单台机器上运行，甚至是单个Java虚拟机(Java Virtual Machine)。这种机制使得用户可以在本地测试或者调试Flink程序。本节主要概述Flink本地模式的运行机制。　　本地环境和执行器(executors)运行你在本地的Java虚拟机上运行Flink程序，或者是在属于正在运行程序的如何Java虚拟机上。对于大部分示例程序而言，你只需简单

w397090770 9年前 (2016-04-27) 16516℃ 0评论19喜欢

Flink

Flink：Scala Shell使用指南

　　Flink内置支持交互式的Scala Shell，我们既可以在本地安装模式下或者集群模式下运行它。我们可以通过下面的命令在单机模式下启动Shell:[code lang="scala"]bin/start-scala-shell.sh local[/code]同样，我们可以通过启动Shell时指定remote参数，并提供JobManager的hostname和port等信息，如下：[code lang="scala"]bin/start-scala-shell.sh remote <hostnam

w397090770 9年前 (2016-04-26) 6350℃ 0评论4喜欢

Flink

Flink：Scala API函数扩展

　　为了保存Scala和Java API之间的一致性，一些允许Scala使用高层次表达式的特性从批处理和流处理的标准API中删除。　　如果你想体验Scala表达式的全部特性，你可以通过隐式转换(implicit conversions)来加强Scala API。　　为了使用这些扩展，在DataSet API中，你仅仅需要引入下面类：[code lang="scala"]import org.apache.flink.api.scala.extensio

w397090770 9年前 (2016-04-25) 3856℃ 0评论3喜欢

Flink

Flink部署在Google计算引擎平台上

　　本文将介绍如何在Google Compute Engine（https://cloud.google.com/compute/）平台上基于 Hadoop 1 或者 Hadoop 2 自动部署 Flink 。借助 Google 的 bdutil(https://cloud.google.com/hadoop/bdutil) 工具可以启动一个集群并基于 Hadoop 部署 Flink 。根据下列步骤开始我们的Flink部署吧。要求(Prerequisites)安装(Google Cloud SDK)　　请根据该指南了解如何安装 Google Cl

w397090770 9年前 (2016-04-21) 1843℃ 0评论3喜欢

Flink

Flink独立集群模式安装(Cluster Standalone)

在《Flink本地模式安装(Local Setup)》的文章中，我简单地介绍了如何本地模式安装(Local Setup)Flink，本文将介绍如何Flink集群模式安装，主要是Standalone方式。要求（Requirements）Flink可以在Linux, Mac OS X 以及Windows（通过Cygwin）等平台上运行。集群模式主要是由一个master节点和一个或者多个worker节点组成。在你启动集群的各个组件之前

w397090770 9年前 (2016-04-20) 11915℃ 0评论9喜欢

上一页
1
2
3
4
5
6
7
8
下一页
共 8 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

标签：Flink

Tumbling Windows vs Sliding Windows区别与联系

Apache Flink：Table API和SQL发展现状概述

Flink batch模式多路文件输出(MultipleTextOutputFormat)

Flink Streaming中实现多路文件输出(MultipleTextOutputFormat)

使用Flink读取Kafka中的消息

Flink：本地执行(Local Execution)

Flink：Scala Shell使用指南

Flink：Scala API函数扩展

Flink部署在Google计算引擎平台上

Flink独立集群模式安装(Cluster Standalone)