Apache Hudi在Linkflow构建实时数据湖的生产实践
1. 背景 Linkflow 作为客户数据平台(CDP),为企业提供从客户数据采集、分析到执行的运营闭环。每天都会通过一方数据采集端点(SDK)和三方数据源,如微信,微博等,收集大量的数据。这些数据都会经过清洗,计算,整合后写入存储。使用者可以通过灵活的报表或标签对持久化的数据进行分析和计算,结果又会作为MA (Marketing Automation) 系统的数据源,从而实现对特定人群...

字节跳动基于Apache Hudi构建EB级数据湖实践
接下来将分为场景需求、设计选型、功能支持、性能调优、未来展望五部分介绍Hudi在字节跳动推荐系统中的实践。 ...


KLOOK客路旅行基于Apache Hudi的数据湖实践
1. 业务背景介绍 客路旅行(KLOOK)是一家专注于境外目的地旅游资源整合的在线旅行平台,提供景点门票、一日游、特色体验、当地交通与美食预订服务。覆盖全球100个国家及地区,支持12种语言和41种货币的支付系统,与超过10000家商户合作伙伴紧密合作,为全球旅行者提供10万多种旅行体验预订服务。KLOOK数仓RDS数据同步是一个很典型的互联网电商公司数仓接入层的需求。对于公司数仓,约6...

Robinhood基于Apache Hudi的下一代数据湖实践
1. 摘要Robinhood 的使命是使所有人的金融民主化。 Robinhood 内部不同级别的持续数据分析和数据驱动决策是实现这一使命的基础。 我们有各种数据源——OLTP 数据库、事件流和各种第 3 方数据源。需要快速、可靠、安全和以隐私为中心的数据湖摄取服务来支持各种报告、关键业务管道和仪表板。不仅在数据存储规模和查询方面,也在我们在数据湖支持的用例方面,我们从最初的数据湖版本都取得了很大....

Uber基于Apache Hudi构建PB级数据湖实践
1. 引言从确保准确预计到达时间到预测最佳交通路线,在Uber平台上提供安全、无缝的运输和交付体验需要可靠、高性能的大规模数据存储和分析。2016年,Uber开发了增量处理框架Apache Hudi,以低延迟和高效率为关键业务数据管道赋能。一年后,我们开源了该解决方案,以使得其他有需要的组织也可以利用Hudi的优势。接着在2019年,我们履行承诺,进一步将其捐赠给了Apache Software....

Apache Hudi 在 B 站构建实时数据湖的实践
本文作者喻兆靖,介绍了为什么 B 站选择 Flink + Hudi 的数据湖技术方案,以及针对其做出的优化。主要内容为:传统离线数仓痛点数据湖技术方案Hudi 任务稳定性保障数据入湖实践增量数据湖平台收益社区贡献未来的发展与思考GitHub 地址 https://github.com/apache/flink欢迎大家给 Flink 点赞送 star~一、传统离线数仓痛点1. 痛点之前 B 站数仓....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
Apache hudi相关内容
- Apache hudi lakehouse
- hudi Apache
- Apache hudi s3
- Apache hudi最佳实践
- Apache hudi架构
- Apache hudi cdc
- Apache hudi构建管道
- Apache hudi管道
- Apache hudi分析
- Apache hudi存储
- Apache hudi场景
- Apache hudi索引分析
- Apache hudi索引
- hudi Apache索引分析
- Apache hudi deltalake
- Apache hudi示例
- 数据湖Apache hudi
- Apache hudi zeppelin
- Apache hudi集成
- Apache hudi应用场景
- 实战Apache hudi
- 实战datadog监控Apache hudi
- Apache hudi事务
- Apache hudi大规模数据湖
- Apache hudi数据湖
- Apache hudi构建数据湖
- Apache hudi迁移机制
- Apache hudi异步compaction
- Apache hudi异步部署
- Apache hudi异步
Apache更多hudi相关
- Apache hudi amazon emr
- Apache hudi运行
- Apache hudi功能
- 技术Apache hudi
- 查询Apache hudi
- Apache hudi方案
- Apache hudi构建lakehouse
- Apache hudi实时数据湖
- Apache hudi构建实时数据湖
- Apache pulsar hudi构建lakehouse方案
- Apache hudi平台
- Apache hudi概念
- Apache hudi流批一体实践
- Apache hudi核心概念
- Apache hudi模式
- Apache hudi机制
- Apache hudi实战
- Apache hudi清理
- Apache hudi aws
- Apache hudi湖仓一体
- Apache hudi流批一体
- Apache hudi数据集
- Apache hudi构建平台
- Apache hudi类型
- Apache hudi流式
- Apache hudi payload
- Apache hudi流批一体架构
- Apache hudi数据湖平台
- Apache hudi湖仓
- Apache hudi特性
Apache您可能感兴趣
- Apache meetup
- Apache阿里云
- Apache doris
- Apache日志
- Apache技术
- Apache数据库
- Apache php7.1
- Apache php
- Apache编译
- Apache php版本
- Apache flink
- Apache配置
- Apache rocketmq
- Apache安装
- Apache dubbo
- Apache tomcat
- Apache服务器
- Apache linux
- Apache spark
- Apache开发
- Apache服务
- Apache报错
- Apache mysql
- Apache微服务
- Apache访问
- Apache kafka
- Apache从入门到精通
- Apache实践
- Apache应用
- Apache web
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
+关注