备案控制台登录注册

开源大数据平台 E-MapReduce
弹性稳定、存算分离，帮您快速构建AI时代开源大数据平台底座

立即购买免费试用

100% 兼容开源
100% 采用社区开源组件，随开源版本升级迭代
安全可靠
分钟级搭建大数据计算环境，智能诊断分析，Kerberos身份认证，数据加密等
节约成本
计算资源按需使用，自动数据冷热分层存储, 支持阿里云抢占式实例等
弹性资源
支持按负载/时间配置规则，分钟级弹性伸缩，支持多种弹性资源类型

1/0

产品动态

开源大数据平台E-MapReduce全新能力升级，新用户免费体验

产品新功能

EMR on ECS 重磅推出托管弹性伸缩功能

托管弹性伸缩能够自动根据您的业务负载动态调整Task节点数量，并根据历史作业执行情况来优化资源分配。这样既保证了任务的顺利完成，又有效控制了成本。

2025-01-17

新规格

StarRocks快速使用数据湖分析版实例

新功能

EMR Serverlss Spark 使用 Python 第三方库

新功能

EMR Serverless Spark 提交 Pyspark 任务

新功能

StarRocks慢SQL支持诊断建议

产品简介

开源大数据平台 E-MapReduce（简称“EMR”）是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto、ClickHouse等开源大数据计算和存储引擎。EMR计算资源支持灵活的弹性控制。EMR支持on ECS、on ACK以及Serverless多种部署形态。

开源大数据平台 E-MapReduce

产品优势

开源大数据平台 E-MapReduce（简称“EMR”）为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto等开源大数据计算和存储引擎，支持on ECS、on ACK以及Serverless多种部署形态，选择EMR，您可以轻松构建具备以下优势的云上服务。

100%兼容开源社区组件，性能较开源版本提升3-5倍

100%采用社区开源组件，随开源版本升级迭代。适配开源组件，避免开源组件之间的版本兼容性问题。基于开源组件优化和增强阿里云部署环境，性能远高于开源版本。

分钟级搭建大数据计算环境，支持智能诊断分析

分钟级搭建大数据计算环境，支持一键调整计算资源规模，无需人工部署和启动服务。完善的监控和告警体系，支持智能诊断分析，大幅缩减排障路径，提升运维效率。

计算资源按需使用，自动数据冷热分层存储，支持抢占式实例等多种优化手段

计算资源按需使用，降低闲置算力成本；自动数据冷热分层存储，降低单位存储成本。丰富的运维辅助工具，智能诊断分析，便捷管理大数据平台，降低运维成本；支持阿里云抢占式实例、预留实例券（RI）、混合计费等多种成本优化手段，进一步压缩成本支出。

支持按负载/时间，灵活配置规则；分钟级弹性伸缩，支持多种弹性资源类型

支持按负载/时间，可灵活的根据业务场景配置规则。分钟级弹性伸缩，极高效率，响应快速变化的业务诉求。支持多种弹性资源类型。

Gartner®

国际权威咨询机构 IDC (国际数据有限公司) 中国首次发布了《IDC MarketScape: 中国实时湖仓市场 2024 年厂商评估》，凭借领先的产品技术服务及市场策略，阿里云在首次报告发布即入选领导者类别。其中，阿里云在能力维度获中国第一。

国际权威咨询机构 IDC (国际数据有限公司) 中国首次发布了《IDC MarketScape: 中国实时湖仓市场 2024 年厂商评估》，凭借领先的产品技术服务及市场策略，阿里云在首次报告发布即入选领导者类别。其中，阿里云在能力维度获中国第一。

安全合规

阿里云EMR是一种托管的开源大数据处理服务,支持弹性扩展,处理PB级海量数据,并提供ACL、加密、Kerberos等安全机制,让用户无需搭建和管理复杂的大数据环境,通过简单配置就可启动使用,与其他大数据产品深度集成,可一站式处理和分析数据。

卡片头部图

网络和基础设施安全

访问隔离：通过安全组管理，对集群内的ECS实例进行出方向和入方向的网络控制，满足业务网络保护要求。

存储传输加密：通过数据盘加密，对动态数据传输及静态数据加密，保护数据的隐私性和自主性，为业务数据提供安全边界。

卡片头部图

系统安全

权限管控：通过阿里云通用RAM访问控制鉴权，控制对EMR集群资源的操作权限。

操作审计：通过阿里云Action Trail操作审计查询用户操作EMR产生的管控事件，满足业务实时审计、问题回溯分析需求。

卡片头部图

容灾安全

数据容灾：数据支持多副本存储，任一数据出现问题时，副本数据自动切换恢复，保证数据的可靠性。

服务容灾：通过核心组件高可用部署，保障任一服务节点故障时，能够自动切换，保证服务不受影响。

客户案例

开源大数据平台EMR为您提供安全可靠、弹性伸缩的云原生大数据平台，在不同行业内都沉淀了不少客户案例，为广大客户解决了诸多业务挑战。

01

喜马拉雅

“阿里云的开源大数据平台可以兼容业界开源大数据协议，在合作的过程中，我们也能感受到阿里云开源开放的态度，这点非常符合喜马拉雅坚持走开源大数据的发展理念。”喜马拉雅大数据工程负责人陈叶超强调。

02

猿辅导

为了应对不同的业务场景，我们希望能够有一个引擎，可以完成在 AP 场景下的统一，这时就发现了 StarRocks， StarRocks 借助于它本身优秀的向量化引擎的能力，能够在大部分场景下性能提升显著，因此我们决定将更多的场景基于 StarRocks 来做。猿辅导大数据平台团队负责人申阳

立即体验，在阿里云创造未来

想体验更多产品功能？

立即购买开源大数据平台 E-MapReduce产品

了解更多阿里云产品介绍？

探索阿里云产品了解更多产品介绍

遇到了困难需要帮助？

联系我们咨询阿里云服务团队

你好，我是AI助理

可以解答问题、推荐解决方案等