阿里云文档 2025-03-21

Spark on ACK概述

Spark on ACK是ACK基于Spark on Kubernetes提供的解决方案,让您能够基于ACK提供的企业级容器应用管理能力,快速构建高效、灵活且可扩展的Spark大数据处理平台。

阿里云文档 2025-03-13

Spark作业的多集群调度与分发

Apache Spark是一种专门用于大规模数据处理的计算引擎,广泛应用于数据分析和机器学习等场景。本文介绍如何通过ACK One舰队将Spark作业在多集群中进行调度和分发运行,帮助您提升多集群中空闲资源利用率。

阿里云文档 2025-03-13

基于实际剩余资源的多集群Spark作业调度与分发

如果您已经拥有多个正在运行在线服务的ACK集群,并希望在不影响这些服务的情况下,充分利用集群的空闲资源来运行Spark作业,您可以利用ACK One舰队的多集群Spark作业调度和分发能力来提高资源利用率。本文将介绍如何通过ACK One舰队和ACK Koordinator组件,根据各集群实际剩余资源(而非请求资源)来调度和分发多集群Spark作业,帮助您最大化多集群中闲置资源的利用效率,并通过优...

阿里云文档 2025-03-13

基于实际剩余资源的多集群Spark作业调度与分发

如果您已经拥有多个正在运行在线服务的ACK集群,并希望在不影响这些服务的情况下,充分利用集群的空闲资源来运行Spark作业,您可以利用ACK One舰队的多集群Spark作业调度和分发能力来提高资源利用率。本文将介绍如何通过ACK One舰队和ACK Koordinator组件,根据各集群实际剩余资源(而非请求资源)来调度和分发多集群Spark作业,帮助您最大化多集群中闲置资源的利用效率,并通过优...

阿里云文档 2025-02-26

为Spark作业配置动态资源分配

本文介绍在Spark中如何配置和使用动态资源分配(Dynamic Resource Allocation)功能,以最大化集群资源的利用效率,减少资源闲置,同时提升任务执行的灵活性和整体系统性能。

文章 2020-07-01 来自:开发者社区

在 kubernetes 中用 alluxio 加速 spark 数据访问

镜像下载、域名解析、时间同步请点击 阿里巴巴开源镜像站 一、背景信息 1. alluxio Alluxio是一个开源的基于内存的分布式存储系统,适合作为云上大数据和AI / ML的数据编排方案。Alluxio可以同时管理多个底层文件系统,将不同的文件系统统一在同一个名称空间下,让上层客户端可以自由访问统一名称空间内的不同路径,不同存储系统的数据。 alluxio的short-circuit功能可....

在 kubernetes 中用 alluxio 加速 spark 数据访问
文章 2020-06-30 来自:开发者社区

在kubernetes中用alluxio加速spark数据访问(二)

相关文章: 在kubernetes中用alluxio加速spark数据访问(一) 1.背景信息 1.1 alluxio Alluxio是一个开源的基于内存的分布式存储系统,适合作为云上大数据和AI / ML的数据编排方案。Alluxio可以同时管理多个底层文件系统,将不同的文件系统统一在同一个名称空间下,让上层客户端可以自由访问统一名称空间内的不同路径,不同存储系统的数据。 alluxio的sh....

在kubernetes中用alluxio加速spark数据访问(二)
文章 2020-06-30 来自:开发者社区

在Kubernetes中用Alluxio加速Spark数据访问(一)

相关文章: 在Kubernetes中用Alluxio加速Spark数据访问(二) 1.背景信息 1.1 alluxio Alluxio是一个开源的基于内存的分布式存储系统,适合作为云上大数据和AI / ML的数据编排方案。Alluxio可以同时管理多个底层文件系统,将不同的文件系统统一在同一个名称空间下,让上层客户端可以自由访问统一名称空间内的不同路径,不同存储系统的数据。 alluxio的sh....

在Kubernetes中用Alluxio加速Spark数据访问(一)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

+关注
相关镜像