问答 2022-07-26 来自:开发者社区

flink里 怎么解决物理删除,join表时,数据混乱的问题。

flink里 怎么解决物理删除,join表时,数据混乱的问题。

问答 2022-06-23 来自:开发者社区

请问,flink sql 批任务,两表或多表join(inner join 或 outer join

请问,flink sql 批任务,两表或多表join(inner join 或 outer join),可不可以手动指定表,在流程图里传输到下游的传输方式为broadcast而不是根据关联条件中的字段hash的方式。

问答 2022-06-13 来自:开发者社区

flink延迟join维表要怎么去实现了

flink延迟join维表要怎么去实现了

文章 2022-06-13 来自:开发者社区

Flink之join多流合并

(1)window多流合并在Flink中支持窗口上的多流合并,即在一个窗口中按照相同条件对两个输入数据流进行关联操作,需要保证输入的Stream要构建在相同的Window上,并使用相同类型的Key作为关联条件。(2)Window joinWindows类型的join都是利用window的机制,先将数据缓存在Window State中,当窗口触发计算时,执行join操作;interval join....

Flink之join多流合并
问答 2022-06-13 来自:开发者社区

关于flink sql join,有时候数据会漏,这个有啥解决方案?

关于flink sql join,有时候数据会漏,这个有啥解决方案?

问答 2022-03-30 来自:开发者社区

flink CDC使用join的时候表更新如何反馈到sink table

Meta Source:【①群】Apache Flink China社区 Time:2021/11/10 10:44 Proposer:王杰 Status:Unresovled Content 王杰 flink cdc 做数据打宽,insert into C select * from A JION B 在第一次同步到数据后,T+1场景单独更新A或者B,C更新不了全部列的数据,这种情况有什...

问答 2022-03-30 来自:开发者社区

flink sql regular join 是不是把两个流的数据都保存起来

Meta Source:【①群】Apache Flink China社区 Time:2021/11/10 17:13 Proposer:郑淑彬 Status:Resovled Content 郑淑彬 Q: flink sql regular join 是不是把两个流的数据都保存起来Jeff Zhang 简锋 看官方文档

文章 2022-02-17 来自:开发者社区

​实战:Flink 1.12 维表 Join Hive 最新分区功能体验

我们生产常有将实时数据流与 Hive 维表 join 来丰富数据的需求,其中 Hive 表是分区表,业务上需要关联上 Hive 最新分区的数据。上周 Flink 1.12 发布了,刚好支撑了这种业务场景,我也将 1.12 版本部署后做了一个线上需求并上线。对比之前生产环境中实现方案,最新分区直接作为时态表提升了很多开发效率,在这里做一些小的分享。 ● Flink 1.12 前关联 Hive 最新....

​实战:Flink 1.12 维表 Join Hive 最新分区功能体验
文章 2022-02-17 来自:开发者社区

Flink SQL 实战:双流 join 场景应用

作者:余敖 本文主要介绍在流式场景中 join 的实战。大家都知道在使用 SQL 进行数据分析的过程中,join 是经常要使用的操作。在离线场景中,join 的数据集是有边界的,可以缓存数据有边界的数据集进行查询,有Nested Loop/Hash Join/Sort Merge Join 等多表 join;而在实时场景中,join 两侧的数据都是无边界的数据流,所以缓存数据集对长时间 job ....

Flink SQL 实战:双流 join 场景应用
文章 2022-02-17 来自:开发者社区

Flink 双流 Join 的3种操作示例

在数据库中的静态表上做 OLAP 分析时,两表 join 是非常常见的操作。同理,在流式处理作业中,有时也需要在两条流上做 join 以获得更丰富的信息。Flink DataStream API 为用户提供了3个算子来实现双流 join,分别是:join()coGroup()intervalJoin()本文举例说明它们的使用方法,顺便聊聊比较特殊的 interval join 的原理。准备数据从....

Flink 双流 Join 的3种操作示例

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注