文章 2025-03-18 来自:开发者社区

天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践

导读:天翼云基于 Apache Doris 成功落地项目已超 20 个,整体集群规模超 50 套,部署节点超 3000 个,存储容量超 15PB。天翼云基于 Apache Doris 和 Apache Iceberg 构建的湖仓一体方案,兼具灵活性、高性能和低成本优势,同时满足了报表和 BI 分析、湖仓融合分析、日志存储分析、高并发实时分析、MPPDB 国产化替代等多种场景需求。 本文转录自李.....

天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践
文章 2025-03-01 来自:开发者社区

小米基于 Apache Paimon 的流式湖仓实践

摘要:本文整理自计算平台软件研发工程师钟宇江老师在 Flink Forward Asia 2024 流式湖仓(一)专场中的分享。内容主要为以下三部分: 背景介绍 基于 Paimon 构建近实时数据湖仓 未来展望 01背景介绍 第一部分是背景介绍,简单介绍之前的典型的实时数仓的架构,以及引入 Apache Pai...

小米基于 Apache Paimon 的流式湖仓实践
文章 2025-02-26 来自:开发者社区

小米基于 Apache Paimon 的流式湖仓实践

摘要:本文整理自计算平台软件研发工程师钟宇江老师在 Flink Forward Asia 2024 流式湖仓(一)专场中的分享。内容主要为以下三部分: 一、背景介绍 二、基于 Paimon 构建近实时数据湖仓 三、未来展望 一、背景介绍 第一部分是背景介绍,简单介绍之前的典型的实时数仓的架构,以及引入 Apache Paimon 的原因。 1.1 当前实时湖仓计算框架以 Flink + ...

小米基于 Apache Paimon 的流式湖仓实践
文章 2025-01-21 来自:开发者社区

金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践

导读:中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用 Apache Doris 替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。 本文转录自陈地长(中信信用.....

金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
文章 2024-11-29 来自:开发者社区

Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践

WebEx 是 Cisco 推出的远程、实时的网络会议平台。全球财富 500 强公司中约有 95% 的公司采用 WebEx 来作为视频会议工具,日均会议次数突破 150 万次,全球业务市场超过 160 个。随着市场规模的扩大及使用者持续增加,亟需一个数据平台提供全面的数据及处理分析,以支持故障排查、批量和实时的分析、BI 和大模型的应用、可观测性与数据治理等需求。 在此背景下,WebEx 数据平....

Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
文章 2024-11-04 来自:开发者社区

巴别时代使用 Apache Paimon 构建 Streaming Lakehouse 的实践

随着数据湖技术的不断发展,越来越多的企业开始探索如何利用这一新兴技术来优化数据处理流程。Apache Paimon 是一款高性能的数据湖框架,它支持流式处理和批处理,能够为实时数据分析提供强大的支持。本文将分享巴别时代在构建基于 Apache Paimon 的 Streaming Lakehouse 方面的一些探索和实践经验。 Apache Paimon...

文章 2024-11-03 来自:开发者社区

构建高可用性Apache Kafka集群:从理论到实践

引言 随着大数据时代的到来,数据传输与处理的需求日益增长。Apache Kafka作为一个高性能的消息队列服务,因其出色的吞吐量、可扩展性和容错能力而受到广泛欢迎。然而,在构建大规模生产环境下的Kafka集群时,保证其高可用性是至关重要的。本文将从个人实践经验出发,详细介绍如何构建一个高可用性的Kafka集群,包...

构建高可用性Apache Kafka集群:从理论到实践
文章 2024-10-21 来自:开发者社区

10月26日@杭州,飞轮科技 x 阿里云举办 Apache Doris Meetup,探索保险、游戏、制造及电信领域数据仓库建设实践

10月26日,由飞轮科技与阿里云联手发起的 Apache Doris 杭州站 Meetup 即将开启! 本次活动邀请了来自星火智云、玩心不止、飞轮科技、正泰集团、霖梓控股、中国电信等多位技术专家,为参会者分享在保险、游戏、制造和电信等领域的应用案例。演讲涵盖 Apache Doris 及阿里云数据库 SelectDB 版在各领域的数据仓库落地方案及场景实践,并将探讨在日志存储与...

10月26日@杭州,飞轮科技 x 阿里云举办 Apache Doris Meetup,探索保险、游戏、制造及电信领域数据仓库建设实践
文章 2024-08-26 来自:开发者社区

Apache Flink 实践问题之ZooKeeper 网络瞬断时如何解决

问题一:ZooKeeper 网络瞬断时,Flink JobManager 会遇到什么问题,以及这是如何影响 Flink 作业的? ZooKeeper 网络瞬断时,Flink JobManager 会遇到什么问题,以及这是如何影响 Flink 作业的? ...

Apache Flink 实践问题之ZooKeeper 网络瞬断时如何解决
文章 2024-08-26 来自:开发者社区

Apache Flink 实践问题之达到网卡的最大速度如何解决

问题一:为什么增加compression.type后,发送带宽并未按预期提升? 为什么增加compression.type后,发送带宽并未按预期提升? 参考回答: 增加compression.type后,发送带宽并未按预期提升的原因是Kafka在低版本时存在压缩比验证问题。验证脚本中的每个值被视为相同,导致压缩比测试时偏高,但在实际生产环境中,每条数据...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等