文章 2023-08-10 来自:开发者社区

Flink之水位线(Watermark) 2

如何生成水位线上一节中我们讲到,水位线是用来保证窗口处理结果的正确性的,如果不能正确处理所有乱序数据,可以尝试调大延迟的时间。那在实际应用中,到底应该怎样生成水位线呢?本节我们就来讨论这个问题。1.生成水位线的总体原则我们知道,完美的水位线是“绝对正确”的,也就是一个水位线一旦出现,就...

Flink之水位线(Watermark) 2
文章 2023-08-10 来自:开发者社区

Flink之水位线(Watermark)1

在流数据处理应用中,一个很重要、也很常见的操作就是窗口计算。所谓的“窗口”,一般就是划定的一段时间范围,也就是“时间窗”;对在这范围内的数据进行处理,就是所谓的窗口计算。所以窗口和时间往往是分不开的。接下来我们就深入了解一下 Flink 中的时间语义和窗口的应用。时间语义“时间”,从理论物理和哲学的角度解释&#x...

Flink之水位线(Watermark)1
问答 2023-07-13 来自:开发者社区

各位大佬, Flink CDC中通过tenv.但是执行任务的时候,发现watermark还是被+8?

各位大佬,Flink CDC中通过tenv.getConfig().setLocalTimeZone(ZoneId.of("Asia/Shanghai"));设置了时区。但是执行任务的时候,发现watermark还是被+8小时了,看起来配置没有生效。有大佬遇到过吗?

问答 2023-07-02 来自:开发者社区

flink sql/table watermark 迟到数据有办法获取到吗 ,有老师能给指点?

flink sql/table watermark 迟到数据有办法获取到吗 ,有老师能给指点指点吗?

问答 2023-06-18 来自:开发者社区

因为Flink CDC源表不是不能定义watermark嘛,那我可以select*一个新表,然后在?

问题1:因为Flink CDC源表不是不能定义watermark嘛,那我可以select*一个新表,然后在新表上定义watermark从而开窗聚合吗?这样可以将流处理变为批处理。 不知我的想法可不可行? 问题2:emmm应该是吧(flink理解的不是很深),不知道这可行吗,我是用这个来算数据(捕获到数据包的时间戳)开窗聚合1s,因为得用jion来获取前面一列的数据。所以我觉得如果改为water.....

问答 2023-05-30 来自:开发者社区

数据不连续 后续一段时间内没有数据进来 flink watermark 不变 会导致窗口不关闭 ?

问个问题:数据不连续 后续一段时间内没有数据进来 flink watermark 不变 会导致窗口不关闭 数据丢失问题 怎么解决 1.自己写一个推进watermark 还有其他更好的方式解决这个问题吗?

问答 2023-05-23 来自:开发者社区

Flink CDC中interval join 有什么办法可以把超过watermark又没匹配上的?

Flink CDC中interval join 有什么办法可以把超过watermark又没匹配上的数据收集到吗??找了半天没找到可以设置sideOutputLateData的地方?

文章 2023-03-09 来自:开发者社区

图解flink watermark工作原理

watermark 我们从英文单词拆解翻译,就是水位线。既然是水位线,所以我觉得通过试管(化学实验器皿)来描述这个最合适不过了。 flink引入窗口机制是为了处理无序数据流入的问题,那么窗口什么时候触发呢,那么必须约定一个全局的时间点,这个时间点就是waterMark。举例:我们往试管里面倒入水(偶尔是持续的偶尔是断断续续的)同时要观察试管里面水的读数并记录下来,并且规定每增加20ml的水做一.....

图解flink watermark工作原理
问答 2023-03-08 来自:开发者社区

请问flink 1.13.3支持group by按天指标聚合吗?在不使用watermark的情况下。

flink 1.13.3支持group by按天指标聚合吗?在不使用watermark的情况下。

文章 2023-02-26 来自:开发者社区

带你理解并使用flink中的WaterMark机制

@[TOC]一、引导提问:你了解事件的乱序吗?乱序是怎么产生的呢?在flink流处理中是以什么事件类型判定乱序的呢?当一条一条的数据从产生到经过消息队列传输,然后Flink接受后处理,这个流程中数据都是按照数据产生的先后顺序在flink中处理的,这时候就是有序的数据流。温馨提示:理解下面的图时,可以把数字看作是事件产生的先后顺序有序的数据流如下图:如果过程中出现异常,有些数据延迟了,造成了后面产....

带你理解并使用flink中的WaterMark机制

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注