为了使用告警功能,您需要先创建相应的告警实例,并将其添加到所选的告警组中。创建告警实例 进入安全中心页面。使用阿里云账号(主账号)或RAM用户登录 E-MapReduce控制台。在左侧导航栏,选择 EMR Workbench Workflow。在Workflow页面,...
本文为您介绍如何使用客户端方式连接Serverless StarRocks实例。前提条件 已创建Serverless StarRocks实例,详情请参见 创建实例。使用SQL Editor连接StarRocks 进入StarRocks Manager页面。登录 E-MapReduce控制台。在左侧导航栏,选择 ...
hadoop jar HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-x.x.x.jar wordcount \-Dalluxio.user.file.writetype.default=CACHE_THROUGH \-libjars/PATH_TO_ALLUXIO/client/alluxio-x.x.x.-client.jar \ path1 path2 说明...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权RAM身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
本文介绍E-MapReduce Druid使用过程中遇到的一些常见问题以及解决方法。索引失败问题分析思路 当发现索引失败时,一般遵循如下排错思路:对于批量索引 如果curl直接返回错误,或者不返回,检查一下输入文件格式。或者curl加上-v 参数,观察...
本文介绍在E-MapReduce作业配置中使用的OSS URI。OSS URI 使用E-MapReduce时,通常会使用两种OSS URI:native URI:oss:/bucket[.endpoint]/object/path。您在作业中指定输入输出数据源时使用此URI,等同于 hdfs:/。您操作OSS数据时,可以...
本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍,请参见 使用OpenAPI。基本信息 版本说明 E-MapReduce 版本号 说明 2021-03-20 推荐使用。EMR Workbench 版本号 说明 2024-04-30 推荐使用...
阿里云E-MapReduce SDK包含阿里云Java SDK公共部分和E-MapReduce部分,公共部分依赖 aliyun-java-sdk-core,E-MapReduce部分依赖 aliyun-java-sdk-emr。我们推荐您采用Maven的方式来管理您的工程。Maven依赖 dependency groupId ...
本文描述开源大数据平台E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权RAM身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
本文介绍了E-MapReduce的SDK和API相关的内容,供您进行对应的开发操作。EMR on ECS API概览 SDK概述 EMR Serverless Spark API概览 SDK参考
EMR on ECS服务角色允许E-MapReduce服务在配置资源或执行服务级别操作时调用其他阿里云服务。例如,服务角色用于在EMR集群启动时创建ECS实例。本文为您介绍EMR服务角色及其权限策略。EMR on ECS会使用到AliyunEMRDefaultRole、...
MapReduce WordCount:单词统计 Hive sample.hive:表的简单查询 Pig sample.pig:Pig处理OSS数据实例 Spark SparkPi:计算Pi SparkWordCount:单词统计 LinearRegression:线性回归 OSSSample:OSS使用示例 MaxComputeSample:MaxCompute...
阿里云E-MapReduce服务(EMR on ECS)在运行时需要具备访问其他阿里云资源及执行相关操作的权限。本文将为您介绍首次使用E-MapReduce服务时,阿里云账号需同意系统自动创建E-MapReduce服务所需的默认角色。背景信息 阿里云E-MapReduce为...
本文以EMR-3.27.0集群为例,通过以下示例为您介绍如何在E-MapReduce集群中开发MR作业。在MapReduce中使用OSS 在MapReduce中读写OSS,需要配置如下参数。说明 请确保在代码运行环境设置了环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_...
登录 E-MapReduce控制台。在左侧导航栏,选择 EMR Serverless Spark。在 Spark 页面,单击目标工作空间名称。在 EMR Serverless Spark 页面,单击左侧导航栏中的 数据开发。新建任务。在 开发目录 页签下,单击 新建。在弹出的对话框中,...
创建Kafka集群 如果需要新建包含Kafka的集群,请登录E-MapReduce新版控制台创建DataFlow类型集群,创建集群详情请参见 创建DataFlow Kafka集群。本地盘Kafka集群 当在本地盘上部署Kafka服务时,您需要在E-MapReduce控制台的 配置 页面,...
当E-MapReduce集群的数据存储空间不足时,您可以根据本文进行磁盘(数据盘和系统盘)扩容。本文为您介绍如何对磁盘进行扩容。背景信息 根据E-MapReduce版本和磁盘属性不同,E-MapReduce支持的磁盘扩容方式也不同,具体说明如下:数据盘:...
E-MapReduce支持在控制台对各服务参数新增、修改、删除配置项等操作进行配置回滚。本文为您介绍如何通过E-MapReduce控制台回滚各服务的参数配置。前提条件 已对服务配置进行实际的操作变更。操作步骤 进入集群服务页面。登录 E-MapReduce...
80 OnDemandPercentageAboveBaseCapacity integer 节点组满足最小按量实例 OnDemandBaseCapacity 要求后,超出的实例中按量实例应占的比例,取值范围:0~100。80 SpotInstancePools integer 指定可用实例规格的个数,伸缩组将按成本最低的...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来处理分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer的实现,基于OSS的Multipart Upload接口,...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来处理分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer的实现,基于OSS的Multipart Upload接口,...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来处理分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer的实现,基于OSS的Multipart Upload接口,...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来处理分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer的实现,基于OSS的Multipart Upload接口,...
部署集是阿里云ECS(Elastic Compute Service)提供的能力,用于控制ECS实例分布的策略,从而提升ECS实例的容灾能力和可用性。在创建EMR集群或新增节点组时,您可以选择是否启用部署集,并为不同节点组配置不同的部署集策略,从而提升集群...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来处理分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer的实现,基于OSS的Multipart Upload接口,...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
本文介绍E-MapReduce开发的准备工作。准备工作如下:请确认您已经开通了阿里云服务,并创建了AccessKey ID和AccessKey Secret。请确认您已开通OSS。您已经对Spark、Hadoop、Hive和Pig具备一定的认识。文中不对Spark、Hadoop、Hive和Pig开发...
保存工作流后,您可以对已有的任务定义和任务实例进行操作。本文为您介绍如何管理任务定义和任务实例。任务定义操作 在 任务定义 页面,您可以执行以下操作。操作 说明 版本 只能切换至处于下线状态的任务定义。删除 只能删除处于下线状态...
在开发过程中我们通常会碰到需要迁移数据的场景,本文介绍如何将自建集群数据迁移到E-MapReduce集群中。背景信息 适用范围:线下Hadoop到E-MapReduce迁移。线上ECS自建Hadoop到E-MapReduce迁移。迁移场景:HDFS增量上游数据源包括RDS增量...
当您使用阿里云E-MapReduce(简称EMR)时,可以根据本文查找对应的问题场景和解决方案。计费常见问题 集群管理常见问题 组件常见问题:HDFS常见问题 YARN常见问题 Hudi常见问题 Hive常见问题 HBase常见问题 Kudu常见问题 Spark常见问题 ...
大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业...架构图 方案详情 详情请参见 E-MapReduce弹性低成本离线大数据分析最佳实践。icmsDocProps={'productMethod':'created','language':'zh-CN',};
通过登录 云服务器ECS控制台,在实例列表中将鼠标移动到对应ECS节点的标签图标上,可以查看该ECS节点属于哪个集群以及在集群中的角色。例如,某个ECS节点上的系统标签如下:acs:emr:clusterId=c-59efc7546480*acs:emr:nodeGroupType=CORE ...
当节点组内ECS实例的规格(vCPU和内存)无法满足您的业务需求时,您可以使用配置升级功能提升ECS实例规格。本文为您介绍如何升级节点的配置。前提条件 已创建集群,详情请参见 创建集群。使用限制 大数据型和本地SSD型ECS实例不支持升级...
在执行E-MapReduce(简称EMR)集群节点扩容操作中,开启尽力交付功能后,如果遇到ECS资源库存不足或ECS部署失败异常等情况,系统会竭尽全力交付所有成功创建的节点到集群中,以维持整体业务的顺畅运行。前提条件 已创建数据湖(DataLake)...
与Hive On MR(MapReduce)相比,Hive On Tez具有更好的查询性能和稳定性。Hive基于MapReduce提交任务和基于Tez提交任务流程图如下所示:Tez的详细信息,请参见 Apache TEZ。开启Tez引擎 Hive支持使用Tez引擎执行SQL任务,在执行任务前您...
阿里云E-MapReduce将于2024年03月1日0时起,更新 E-MapReduce服务等级协议,新版SLA丰富了“1.5 有效请求”的定义,添加 CreateCluster-创建集群、IncreaseNodes-扩容、DecreaseNodes-缩容、弹性伸缩 接口请求。请您留意条款变更,如有问题...
外部客户端支持 客户端SDK提供了E-MapReduce集群外访问E-MapReduce JindoFS 的文件系统的能力,通过客户端可以访问Block模式的Namespace,但外部客户端不能利用到E-MapReduce JindoFS在E-MapReduce集群内部构建的数据缓存,性能上相对于E-...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来解决分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer,基于OSS的Multipart Upload接口,支持OSS...
背景信息 Job Committer是MapReduce和Spark等分布式计算框架的一个基础组件,用来解决分布式任务写数据的一致性问题。Jindo Job Committer是阿里云E-MapReduce针对OSS场景开发的高效Job Committer,基于OSS的Multipart Upload接口,支持OSS...