问答 2024-04-17 来自:开发者社区

Flink这个问题怎么解决?

咨询一个Flink问题, 非开窗,非聚合的数据倾斜有什么优化思路?在保证相同key的数据在一个task 里面处理的前提下,上游kafka的数据是用户每个时间点的属性变化信息, 需要写入到下游数据库,比如这条数据需要给用户的属性做要求和动作,下一条相同用户可能需要做局部更新动作,在或者相同用户做保留首次属性动作我目前的算子结构是: map.filter.keyby.process.sink ==&g...

问答 2024-04-14 来自:开发者社区

咨询一个Flink问题, 非开窗,非聚合的数据倾斜咋优化呀?

咨询一个Flink问题, 非开窗,非聚合的数据倾斜咋优化呀? 前提条件需要保证相同key的数据在一个task 里面处理;场景大概是: 上游kafka的数据是 用户 每个时间点的 用户 属性变化信息(可能这个时间点是 f1, f2, f3,属性变更; 下一个时间点是: f2, f4 属性变更), 需要写入到下游数据库属性变化信息也分几种, 同一条数据中的 属性操作都是一样, 比如这条数据需要 给用....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注