阿里云文档 2024-10-22

如何实现Flink+DLF数据入湖与分析

数据湖构建(DLF)可以结合阿里云实时计算Flink版(Flink VVP),以及Flink CDC相关技术,实现灵活定制化的数据入湖。并利用DLF统一元数据管理、权限管理等能力,实现数据湖多引擎分析、数据湖管理等功能。本文为您介绍Flink+DLF数据湖方案具体步骤。

阿里云文档 2024-09-19

Flink+DLF数据入湖与分析实践

阿里云实时计算Flink版结合DLF Paimon Catalog,实现Flink作业结果到数据湖的高效写入和元数据同步,支持无缝对接多种计算引擎并优化数据湖管理,本文为您介绍具体的操作流程。

问答 2024-08-19 来自:开发者社区

Flink + Canal的实时数据入湖架构存在哪些主要问题?

Flink + Canal的实时数据入湖架构存在哪些主要问题?

文章 2024-03-12 来自:开发者社区

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践

1. 测试过程环境版本说明 Flink1.13.1 Scala2.11 CDH6.2.0 Hadoop3.0.0 Hive2.1.1 Hudi0.10(master) PrestoDB0.256 Mysql5.7 2. 集群服务器基础环境 2.1 Maven和JDK环境版本 ...

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践
文章 2024-02-26 来自:开发者社区

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

一、背景介绍 飞书深诺集团致力于在出海数字营销领域提供全链路服务产品,满足不同企业的全球化营销需求。在广告效果监控和游戏运营业务场景中,为了及时响应广告投放成效与消耗方面的问题和快速监测运营动作效果,实时或准实时数据处理提供了至关重要的技术支撑。 通过对各个业务线实时需求的调研了解到,当前实时数据处理场景是各个业务线基于Java服务独自处理的。各个业务线实时能力不能复用且存在计算...

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践
文章 2023-09-14 来自:开发者社区

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践

摘要:本文整理自 SmartNews 数据平台架构师 Apache Iceberg Contributor 戢清雨,在 Flink Forward Asia 2022 实时湖仓专场的分享。本篇内容主要分为五个部分: SmartNews 数据湖介绍 基于 Icebergv1 格式的数据湖实践 基于 Flink 实时更新的数据湖(Iceberg v2)解决方案 实时更新小文件问...

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践
文章 2023-08-29 来自:开发者社区

如何实现基于Flink的高吞吐、精确一致性数据入湖

1. 概览 AnalyticDB MySQL高度兼容MySQL协议,支持毫秒级更新,亚秒级查询,可以对海量数据进行即时的多维分析透视和业务探索;AnalyticDB MySQL湖仓版(下文简称ADB湖仓版)支持低成本离线处理能力完成数据的清洗加工,同时提供高性能在线分析能力完成数据的洞察探索,真正做到数据湖的规模,数据库的体验。帮助企业降本增效,构建企业级数据分析平台。 ...

如何实现基于Flink的高吞吐、精确一致性数据入湖
文章 2022-05-07 来自:开发者社区

基于Apache Hudi + Flink的亿级数据入湖实践

本次分享分为5个部分介绍Apache Hudi的应用与实践实时数据落地需求演进基于Spark+Hudi的实时数据落地应用实践基于Flink自定义实时数据落地实践基于Flink+Hudi的应用实践后续应用规划及展望1. 实时数据落地需求演进实时平台上线后,主要需求是开发实时报表,即抽取各类数据源做实时etl后,吐出实时指标到oracle库中供展示查询。随着实时平台的稳定及推广开放,各种使用人员有了....

基于Apache Hudi + Flink的亿级数据入湖实践
问答 2022-01-19 来自:开发者社区

Flink CDC 数据入湖的挑战有哪些?

Flink CDC 数据入湖的挑战有哪些?

问答 2022-01-19 来自:开发者社区

Flink CDC 的出现为数据入湖架构提供了哪些新思路?

Flink CDC 的出现为数据入湖架构提供了哪些新思路?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云E-MapReduce

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

+关注