阿里云文档 2024-09-12

使用UDAF实现数据排序和聚合

本文提供了一个自定义聚合函数(UDAF),实现将多行数据合并为一行并按照指定列进行排序,并以居民用电户电网终端数据为例,介绍如何在实时计算控制台使用该函数进行数据聚合和排序。

阿里云文档 2024-09-12

SQL数据血缘关系

Flink作业的血缘关系可以进行作业的数据溯源和追踪、帮助您更好地管理和优化作业的数据流、快速定位问题和评估影响面。本文为您介绍如何通过作业角度和元数据角度查看血缘关系。

文章 2024-08-29 来自:开发者社区

实时计算 Flink版产品使用问题之同步时,上游批量删除大量数据(如20万条),如何提高删除效率

问题一:有前辈 实现过 单个flink cep operator 跑多个 NFA示例的逻辑吗 ? 有前辈 实现过 单个flink cep operator 跑多个 NFA示例的逻辑吗 想在一个job 里面跑多个规则 ? 参考答案: 需要规则引擎处理 关于本问题的更多回答可点击进行查看: https://develop...

阿里云文档 2024-08-14

清理过期数据

清理过期数据可以释放存储空间,优化资源利用并提升系统运行效率等。本文为您介绍如何清理Paimon表过期数据,包括调整快照文件过期时间、设置分区的过期时间、以及清理废弃文件。

阿里云文档 2024-07-30

通过Flink将数据批量导入到Hologres

Hologres推出的新版Flink Connector插件,支持通过Flink将数据批量导入到Hologres,实现高效且低负载的数据导入。

问答 2024-06-03 来自:开发者社区

Flink上游数据是否处理完

Flink上游数据是否处理完

阿里云文档 2024-05-16

Paimon表数据写入和消费

本文为您介绍如何在实时计算开发控制台向Paimon表中插入、更新、覆写或删除数据,以及从Paimon表消费数据,并指定消费位点。

问答 2024-02-26 来自:开发者社区

flink cdc2.4同步数据,上游几十万条数据下游只收到了十几条,ck是开着的,这种是什么情况?

flink cdc2.4同步数据,上游几十万条数据,下游只收到了十几条,ck是开着的,这种是什么情况?用的dinky的整库同步,没有过滤条件呀,。在目标段只能查到很少的数据条数,也没有报错

问答 2024-02-06 来自:开发者社区

Flink CDC里如果上游没办法限制数据流量 sink doris有办法限制写入流量吗 ?

Flink CDC里如果上游没办法限制数据流量 sink doris有办法限制写入流量吗 ?现在遇到情况 sink doris Records Sent几百万了 但是doris里一条数据没有 怎么办?

问答 2023-07-13 来自:开发者社区

请问一下,flink有办法让上游数据均匀分配到下游的map算子么,试了下shuffle和rebal?

请问一下,flink有办法让上游数据均匀分配到下游的map算子么,试了下shuffle和rebalance都会有比较严重的数据倾斜?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注