文章 2024-10-24 来自:开发者社区

阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse

讲师:焦明烨 阿里云计算平台事业部OLAP引擎开发工程师 主要内容: StarRocks数据湖能力介绍 使用阿里云EMR StarRocks构建基于Paimon的极速实时湖仓 StarRocks + Paimon的最新进展 StarRocks + Paimon未来规划     ...

阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
文章 2024-10-17 来自:开发者社区

阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse

摘要:本文整理自阿里云计算平台事业部 OLAP 引擎开发工程师焦明烨老师在8月3日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分为以下四个内容: StarRocks数据湖能力介绍使用阿里云EMR StarRocks构建基于Paimo...

阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
阿里云文档 2024-09-14

Paimon数据源

Apache Paimon是一种流批统一的湖存储格式,支持高吞吐的写入和低延迟的查询,详情请参见Apache Paimon。本文为您介绍如何在EMR Serverless Spark中实现Paimon表的读取与写入操作。

阿里云文档 2024-09-09

在EMR StarRocks上查询Paimon数据

StarRocks从3.1版本开始支持Paimon Catalog。Paimon Catalog是一种External Catalog。通过Paimon Catalog,您可以直接查询Paimon中的数据。本文为您介绍如何在E-MapReduce的StarRocks集群上创建和查看Paimon Catalog。

问答 2024-06-19 来自:开发者社区

在emr运行spark,插入数据到paimon表报错,怎么解决?

在emr运行spark,插入数据到paimon表报错,怎么解决?org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.NullPointerException,

文章 2024-06-12 来自:开发者社区

EMR Serverless Spark:结合实时计算 Flink 基于 Paimon 实现流批一体

简介 EMR Serverless Spark 版是开源大数据平台 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。 实时计算 Flink 版是阿里云提供的全托管 Serverless Flink 云服...

EMR Serverless Spark:结合实时计算 Flink 基于 Paimon 实现流批一体
文章 2024-01-15 来自:开发者社区

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

1. 背景信息数据湖与传统的数据仓库相比,可以更灵活地处理各种类型的数据,并支持高度可扩展的存储,通常被用于大数据分析。为了支持准实时乃至实时的数据处理,数据湖需要能够快速地接收和存储数据(数据入湖),同时提供低延迟的查询性能以满足分析需求。Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文将在阿里云EMR....

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐