文章 2025-03-01 来自:开发者社区

Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践

摘要:本文整理自中阿里云 DataWorks 数据集成团队陈吉通老师在 Flink Forward Asia 2024 生产实践(二)专场中的分享。内容分为以下四个部分: 1.阿里云 DataWorks 数据集成介绍 2.DataWorks 数据集成入湖解决方案的架构和原理 3.DataWorks 数据集成入湖场景的产品化案例分享 4.未来规划 01 阿里...

Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
文章 2024-01-22 来自:开发者社区

Apache Flink 和 Paimon 在自如数据集成场景中的使用

业务背景自如目前线上有基于 Hive 的离线数仓和基于 Flink、Kafka 的实时数仓,随着业务发展,我们也在探索引入湖仓一体的架构更好的支持业务,我们对比了 Iceberg、Hudi、Paimon 后,最终选择 Paimon 作为我们湖仓一体的存储引擎,本文分享下自如在引入 Paimon 做数据集成的一些探索实践。一、原始接入自如目前使用的业务库入 hive 的简略逻辑图如下(拿 Mysq....

Apache Flink 和 Paimon 在自如数据集成场景中的使用
文章 2024-01-08 来自:开发者社区

Apache Flink 和 Paimon 在自如数据集成场景中的使用

业务背景 自如目前线上有基于 Hive 的离线数仓和基于 Flink、Kafka 的实时数仓,随着业务发展,我们也在探索引入湖仓一体的架构更好的支持业务,我们对比了 Iceberg、Hudi、Paimon 后,最终选择 Paimon 作为我们湖仓一体的存储引擎,本文分享下自如在引入 Paimon 做数据集成的一些探索实践。 一...

Apache Flink 和 Paimon 在自如数据集成场景中的使用
阿里云文档 2023-06-01

如何针对资讯聚合类业务场景搭建基于云消息队列Kafka版和实时计算Flink的实时数仓

本文介绍如何针对资讯聚合类业务场景搭建基于云消息队列 Kafka 版和实时计算Flink的实时数仓。

阿里云文档 2022-12-30

如何在使用HDFS进行实时计算场景化时进行优化

本文为您介绍在E-MapReduce(简称EMR)上使用HDFS进行实时计算场景化配置的一些建议,以便优化HDFS的稳定性。

问答 2022-01-19 来自:开发者社区

Flink CDC 社区怎么做好数据集成场景?

Flink CDC 社区怎么做好数据集成场景?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注