文章 2023-09-18 来自:开发者社区

幸福里基于 Flink & Paimon 的流式数仓实践

摘要:本文整理自字节跳动基础架构工程师李国君,在 Streaming Lakehouse Meetup 的分享。幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时数仓建模中遇到了诸多挑战。本次分享主要介绍幸福里业务基于 Flink & Paimon 构建流式数仓的实践经验,从业务背景、流批一体数仓架构、实践中遇到的问题和解决方案,借助 Paimon 最终能拿到的收益,以及....

幸福里基于 Flink & Paimon 的流式数仓实践
问答 2023-09-12 来自:开发者社区

Flink CDC国产数据库tidb在数仓中的应用情况怎么样?

Flink CDC国产数据库tidb在数仓中的应用情况怎么样?

文章 2023-08-18 来自:开发者社区

基于阿里云 Flink+Hologres 搭建实时数仓

背景信息随着社会数字化发展,企业对数据时效性的需求越来越强烈。除传统的面向海量数据加工场景设计的离线场景外,大量业务需要解决面向实时加工、实时存储、实时分析的实时场景问题。传统离线数仓搭建的方法论比较明确,通过定时调度实现数仓分层(ODS->DWD->DWS->ADS);但对于实时数仓的搭建,目前缺乏明确的方法体系。基于 Streaming Warehouse 理念,实现数仓分....

基于阿里云 Flink+Hologres 搭建实时数仓
文章 2023-08-07 来自:开发者社区

芒果 TV 基于 Flink 的实时数仓建设实践

公司简介:芒果 TV 作为湖南广电旗下互联网视频平台,在“一云多屏,多元一体”的战略指导下,通过内容自制,培植核心竞争力,从独播、独特走向独创,并通过市场化运作完成 A 轮、B 轮融资,并于 2018 年 6 月,顺利实现资产重组,成为国内 A 股首家国有控股的视频平台。 一、芒果 TV 实时数仓建设历程 芒果 TV 实时数仓的建设共分为三个阶段,14-19 年为第一阶段,技术选型采用 ...

芒果 TV 基于 Flink 的实时数仓建设实践
文章 2023-07-18 来自:开发者社区

Flink CDC & MongoDB 联合实时数仓的探索实践

摘要:本文整理自 XTransfer 技术专家, Flink CDC Maintainer 孙家宝,在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为四个部分: MongoDB 在实时数仓的探索 MongoDB CDC Connector 的实现原理和使用实践 FLIP-262 MongoDB Connector 的功能预览 总结...

Flink CDC & MongoDB 联合实时数仓的探索实践
问答 2023-07-13 来自:开发者社区

Flink + Doris 做实时数仓 谁有过经验? 怎么做的?

Flink + Doris 做实时数仓 谁有过经验? 怎么做的?

问答 2023-07-12 来自:开发者社区

Flink有没有数仓相关的demo实践?

Flink有没有数仓相关的demo实践?

问答 2023-07-01 来自:开发者社区

谁能指点一下 Flink CDC数据湖与传统数仓的区别与联系呢?

问题1:谁能指点一下 Flink CDC数据湖与传统数仓的区别与联系呢? 问题2:您说的部分功能 指的是存储吗?

文章 2023-06-12 来自:开发者社区

美团买菜基于 Flink 的实时数仓建设

摘要:本文整理自美团买菜实时数仓技术负责人严书,在 Flink Forward Asia 2022 实时湖仓专场的分享。本篇内容主要分为四个部分: 背景介绍 技术愿景和架构设计 典型场景、挑战与应对 未来规划 点击查看原文视频 & 演讲PPT 一、背景介绍 美团买菜是美团自营生鲜零售平台,上面所有的商品都由美团亲自采购,并通过供应链物流体系...

美团买菜基于 Flink 的实时数仓建设
文章 2023-06-06 来自:开发者社区

基于 Flink 的实时数仓建设实践

小米目前的技术架构,在存储侧我们主要应用数据湖 Iceberg 和自研消息队列 Talos,计算层主要应用 Flink 和 Spark,他们统一运行在 Yarn 上,统一通过 Metacat 获取元数据信息,并通过 Ranger 来进行统一的鉴权服务。我们内部使用 Spark 和 Presto 来支撑 OLAP 查询场景&#x...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注