问答 2024-08-04 来自:开发者社区

Flink CDC对接SQL SERVER,源数据库每月需要定期重启CDC导致流数据不完整

使用阿里Flink连接了同在阿里云自建IDC的SQLSERVIER数据库。 由于使用的源数据中有一些大表,开启CDC后磁盘空间占用问题,每个月需要定期重启CDC进行日志清理。 在这个过程(5分钟)只有,会发现flink读取到的源表流数据缺失,请问有什么办法可以规避这个问题码?

问答 2024-05-01 来自:开发者社区

Flink CDC里 每个流数据 想延后2秒后再处理,有什么办法实现?

Flink CDC里 每个流数据 想延后2秒后再处理,有什么办法实现? 只有 assignTimestampsAndWatermarks ?

问答 2024-04-06 来自:开发者社区

Flink 数据源是kafka , 一条流数据是设备的作业指令进度数据(多次更新),如何解决?

Flink 数据源是kafka , 一条流数据是设备的作业指令进度数据(多次更新),一条流是设备的状态(多次更新),有没有比较好的方法将两个流进行关联(以设备号关联),获取实时的指令进度信息和对应设备最新状态?

文章 2024-02-20 来自:开发者社区

【天衍系列 02】深入理解Flink的FileSink 组件:实时流数据持久化与批量写入

Apache Flink 是一个强大的流处理框架,而 FileSink 作为其关键组件之一,负责将流处理结果输出到文件中。本文将详细介绍 FileSink 的各个方面,包括基本概念、实现细节以及代码示例。 01 基本概念 FileSink 是 Flink 中的 Sink 函数,用于将处理后的数...

问答 2023-09-28 来自:开发者社区

Flink CDC流数据视图需要多次使用,第一次insert后,第二次就读不到视图数据了,怎么办?

Flink CDC流数据视图需要多次使用,第一次insert后,第二次就读不到视图数据了,怎么办?

问答 2023-09-17 来自:开发者社区

问一下Flink:我这边使用pyflink将json的流数据写入kafka后,请问应该如何解决?

问一下Flink:我这边使用pyflink将json的流数据写入kafka后,消费得到的数据却变成字段个数统计。如上面两图所示。请问应该如何解决,使得消费得到的数据和写入数据一致?使用的是canal-json格式

问答 2022-09-01 来自:开发者社区

大家好,flink有没有一款包含很多规则的流数据清洗组件呢?

大家好,flink有没有一款包含很多规则的流数据清洗组件呢?

文章 2022-08-22 来自:开发者社区

Flink / Scala- BroadCast 广播流数据先到再处理 Source 数据

一.引言Flink 支持增加 DataStream KeyBy 之后 conncet BroadCastStream 形成 BroadConnectedStream,广播流内数据一般为不间断更新的上下文信息,在本例中,需要针对数据流中的用户信息,基于用于信息 + 广播流内的物料库实现推荐逻辑,针对 BroadConne...

Flink / Scala- BroadCast 广播流数据先到再处理 Source 数据
问答 2022-01-19 来自:开发者社区

Flink 的支持流数据的 Table API 和 SQL 的核心概念是什么?

Flink 的支持流数据的 Table API 和 SQL 的核心概念是什么?

问答 2021-12-08 来自:开发者社区

Flink流数据中的微服务方法是什么呢?

Flink流数据中的微服务方法是什么呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注