阿里云文档 2025-03-20

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2025-03-14

2025-03-03版本说明

本文为您介绍2025年03月03日发布的EMR Serverless Spark的功能变更。

阿里云文档 2025-03-07

包年包月

包年包月是一种预付费计费方式,在购买时需根据所选时长预先支付费用,EMR Serverless Spark 会按照您购买的时长,严格计算计费周期的价格。

阿里云文档 2025-02-27

退订说明

计算资源抵扣包和工作空间的包年包月配额是根据购买时长预先支付的费用,如果不需要使用可以申请退款。本文将为您介绍退订相关的规则及操作流程。

阿里云文档 2025-02-27

续费说明

包年包月的配额到期后,工作空间内提交至包年包月付费类型队列的任务将停止运行。如需继续使用,请及时对包年包月配额进行续费操作。本文将为您介绍续费的具体步骤。

问答 2024-07-31 来自:开发者社区

阿里云E-MapReduce如何讓 spark 任務的 dataframe可以出現在日志之內?

阿里云E-MapReduce想請問我要如何讓 spark 任務的 dataframe.show 或是 stdout 可以出現在日志之內?因為我的 cluster 在任務執行完畢之後就會釋放,所以無法進到 cluster 去看 log。想知道要做什麼設定才能讓這些內容直接出現在日志裡面,感謝。

问答 2024-07-25 来自:开发者社区

阿里云E-MapReduce在 SPARK 任務在不知道 EMR master ip addres

阿里云E-MapReduce在 SPARK 任務在不知道 EMR master ip address 的情況下host 應該要填什麼才可以 access EMR 集群內置 MySQL?

问答 2024-06-12 来自:开发者社区

E-MapReduce集群上跑spark任务时报错This timeout is contro...

E-MapReduce集群上跑spark任务时报错This timeout is controlled by spark.rpc.askTimeout

文章 2022-02-17 来自:开发者社区

通过Job Committer保证Mapreduce/Spark任务数据一致性

作者:李呈祥,花名司麟,阿里云智能EMR团队高级技术专家,Apache Hive Committer, Apache Flink Committer,目前主要专注于EMR产品中开源计算引擎的优化工作。 并发地向目标存储系统写数据是分布式任务的一个天然特性,通过在节点/进程/线程等级别的并发写数据,充分利用集群的磁盘和网络带宽,实现高容量吞吐。并发写数据的一个主要需要解决的问题就是如何保证数据一.....

通过Job Committer保证Mapreduce/Spark任务数据一致性
文章 2022-02-17 来自:开发者社区

通过Job Committer保证Mapreduce/Spark任务数据一致性

并发地向目标存储系统写数据是分布式任务的一个天然特性,通过在节点/进程/线程等级别的并发写数据,充分利用集群的磁盘和网络带宽,实现高容量吞吐。并发写数据的一个主要需要解决的问题就是如何保证数据一致性的问题,具体来说,需要解决下面列出的各个问题: 在分布式任务写数据的过程中,如何保证中间数据对外不可见。 在分布式任务正常完成后,保证所有的结果数据同时对外可见。 在分布式任务失败时,所有结果数据对.....

通过Job Committer保证Mapreduce/Spark任务数据一致性

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐