阿里云文档 2025-12-08

阿里云StarRocks业务使用最佳实践-开源大数据平台 E-MapReduce-阿里云

本文旨在为您介绍StarRocks的基础使用方法和常见操作,适用于首次接触StarRocks的用户。

阿里云文档 2025-09-19

阿里云EMR Serverless Spark Notebook集成DuckDB,支持免密访问OSS/OSS-HDFS并高效操作多种数据格式。

阿里云 EMR Serverless Spark 的 Notebook 会话中引入了 DuckDB 的 Python 库,除了支持 DuckDB 开源版本所具备的所有功能外,还额外提供了免密访问 OSS/OSS-HDFS 的能力,从而能够直接读取 OSS 路径下的文件进行操作。

阿里云文档 2025-07-08

阿里云EMR on ECS部分版本(EMR-1.xx-EMR-5.4.x)即将终止服务与支持

考虑到开源社区技术更迭和EMR产品功能升级,E-MapReduce制定了生命周期策略。根据生命周期策略,阿里云 EMR on ECS 部分版本计划于2025年10月20日EOS(服务与支持终止),建议您尽快升级使用EOS版本的EMR集群实例。

阿里云文档 2025-06-09

使用PyJindo访问阿里云OSS-HDFS

本文将以两种方式为您介绍如何在Python 3.6及更高版本中,利用Python的工具包PyJindo来操作OSS-HDFS。

文章 2025-02-19 来自:开发者社区

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

作者:美的楼宇科技事业部 先行研究中心智能技术部 美的楼宇科技 IoT 数据平台建设背景 美的楼宇科技事业部(以下简称楼宇科技)是美的集团旗下五大板块之一,产品覆盖多联机组、大型冷水机组、单元机、机房空调、扶梯、直梯、货梯以及楼宇自控软件和建筑弱电集成解决方案,远销海内外200多个国家。针对当前设备数据量庞大且持续增长、数据呈现半结构化特点的现状,现有系统仅停留在数据存...

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
阿里云文档 2024-04-25

阿里云账号角色授权

使用EMR Serverless Spark前,需要授予您的阿里云账号AliyunServiceRoleForEMRServerlessSpark和AliyunEMRSparkJobRunDefaultRole系统默认角色。本文为您介绍角色授权的基本操作。

文章 2024-01-15 来自:开发者社区

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

1. 背景信息数据湖与传统的数据仓库相比,可以更灵活地处理各种类型的数据,并支持高度可扩展的存储,通常被用于大数据分析。为了支持准实时乃至实时的数据处理,数据湖需要能够快速地接收和存储数据(数据入湖),同时提供低延迟的查询性能以满足分析需求。Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文将在阿里云EMR....

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse
问答 2022-04-08 来自:开发者社区

基于阿里云 EMR+Jindo 构建多任务大数据调度能力 体现在哪些方面?

基于阿里云 EMR+Jindo 构建多任务大数据调度能力 体现在哪些方面?

文章 2022-02-17 来自:开发者社区

阿里云EMR异步构建云HBase二级索引

一、非HA EMR构建二级索引 云HBase借助Phoenix实现二级索引功能,对于Phoenix二级索引的详细介绍可参考https://yq.aliyun.com/articles/536850?spm=a2c4e.11153940.blogrightarea544746.26.673e7308MxY7Lc当Phoenix表数据量较大时,可以选择异步构建索引方式,利用MR快速同步索引数据,同时....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐