问答 2021-12-05 来自:开发者社区

关于Flink SQL中Interval Join使用时watermark的疑惑

在Flink SQL定义了两张kafka表(A表和B表),类型为debezium-json,然后要进行区间JOIN,SQL类似这样: select * from A left join B on A.id = B.id and B.dt BETWEEN A.dt and A.dt + INTERVAL '30' SECOND 第一个问题是:想要在A和B表中显示定义watermark(dt字段...

问答 2021-12-05 来自:开发者社区

flink sql使用维表关联时报Temporal table join 出现问题

本人使用的flink 版本为1.10.0,planner为BlinkPlanner,用LEFT JOIN FOR SYSTEM_TIME AS OF 语法关联维表: select TUMBLE_END(l.dt, INTERVAL '30' SECOND) as index_time, l.extra_info['cityCode'] as city_code, v.vehicle_level ....

问答 2021-12-03 来自:开发者社区

flink sql 如何实现双流join 的滑动窗口?

打扰大家了。请教下如何实现双流join的滑动窗口。我的代码运行后就报错了。有经验的同学帮忙解答下。谢谢。 代码: SELECT TUMBLE_START(a.ts, INTERVAL '10' MINUTE), TUMBLE_END(a.ts, INTERVAL '10' MINUTE), sum( CASE WHEN f.business_id <> NULL THEN 1 ELSE...

问答 2021-12-02 来自:开发者社区

Flink SQL1.10 大表join如何优化?

我在ui里面可以看到任务也在正常运行,只是每秒输入700条左右,每秒输出1700,所以对比总量来说十分缓慢。  目前不太清楚性能的瓶颈点和优化的方向:  1 网络传输太慢,导致两表不能及时join?这里不知道如何排查,Metrics里面有个netty的相关指标,看不出什么;其他的指标除了hashjoin in和out缓慢变化,其他的都没有什么变化。  2 并行度过低,...

问答 2021-12-02 来自:开发者社区

flink sql join 可以有 state 存储并从 state 恢复数据吗?

有两个表:  tableA: key valueA  tableB: key valueB  我之前用 flink state 的方式存储 tableA,tableB 的消息过来以后去 query 这个 state 得到 valueA  直接 写 flinkSQL 也可以实现这种功能,但这两个表有时间差,任务停止后重新提交会丢失部分 join 的结果。&nb...

问答 2021-12-02 来自:开发者社区

flink sql维表延迟join如何实现?

延迟join主要是为了解决维表数据后于事实表数据到达问题。java代码可以实现,那flink sql这块能否通过sql hint解决呢?有没有示例?*来自志愿者整理的flink邮件归档

文章 2020-12-16 来自:开发者社区

Flink SQL 实战:双流 join 场景应用

作者:余敖 本文主要介绍在流式场景中 join 的实战。大家都知道在使用 SQL 进行数据分析的过程中,join 是经常要使用的操作。在离线场景中,join 的数据集是有边界的,可以缓存数据有边界的数据集进行查询,有Nested Loop/Hash Join/Sort Merge Join 等多表 join;而在实时场景中,join 两侧的数据都是无边界的数据流,所以缓存数据集对长时间 job ....

Flink SQL 实战:双流 join 场景应用
问答 2020-11-04 来自:开发者社区

Flink sql join hive 维表

我在尝试使用 kafka 数据流 join hive 维表时,代码启动之初,Flink 会加载一次 hive 中的维表,但是后续插入到 hive 表中的数据不能被 join 到。 查看官网和中文社区的资料,提示设置 lookup.join.cache.ttl 配置参数,我将这个参数尝试设置在 TableEnv.conf 中,和 Table hits 设置在表名后,都没有起作用。 请问有大佬实...

问答 2020-07-24 来自:开发者社区

有人知道flink sql里面大表join小表怎么去优化吗,比如sparksql的呢种,#Flink

有人知道flink sql里面大表join小表怎么去优化吗,比如sparksql的呢种,broadcast,将小表缓存进去,大表只需要读一次就可以了,不用shuffle的 #Flink

问答 2020-07-09 来自:开发者社区

公司产品底层用的是flink 1.9, sql这块,1.9版本不支持join操作吗? #Flink

公司产品底层用的是flink 1.9, sql这块,1.9版本不支持join操作吗? #Flink

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注