阿里云文档 2025-04-24

基于eRDMA部署3FS高性能分布式存储集群

3FS是深度求索(DeepSeek)公司自主研发的高性能分布式存储系统,专为AI大模型训练、大数据分析及高性能计算(HPC)场景优化设计。在3FS中,融合现代SSD存储与RDMA网络技术,突破传统网络的性能瓶颈。本文介绍如何基于阿里云自研的云上弹性RDMA网络部署3FS集群,实现低延迟与高吞吐数据传输,支撑AI训练和大规模数据分析的高性能需求。

阿里云文档 2025-04-07

集群巡检

本文介绍EDAS对K8s集群的集群巡检功能,旨在指导您完成集群巡检功能的相关操作,包括手动触发巡检、设置周期性自动触发巡检,并提供查看下载巡检报告的相关配置步骤和注意事项。

阿里云文档 2025-04-01

基于ACK One与云效快速构建多集群CD

云效是阿里云提供的一站式DevOps平台,涵盖软件研发全生命周期的工具链和服务管理,可以通过流水线Flow将应用部署到ACK集群中。分布式云容器平台ACK One的应用分发功能可以根据多样的策略(静态权重、动态资源调度、Gang调度等)将Kubernetes资源灵活分配到多个集群,并具备重调度和故障迁移等能力。结合云效自身的CD能力和ACK One的应用分发功能,您可以快速将单集群持续交付构建成多...

阿里云文档 2025-04-01

基于实际剩余资源的多集群Spark作业调度与分发

如果您已经拥有多个正在运行在线服务的ACK集群,并希望在不影响这些服务的情况下,充分利用集群的空闲资源来运行Spark作业,您可以利用ACK One舰队的多集群Spark作业调度和分发能力来提高资源利用率。本文将介绍如何通过ACK One舰队和ACK Koordinator组件,根据各集群实际剩余资源(而非请求资源)来调度和分发多集群Spark作业,帮助您最大化多集群中闲置资源的利用效率,并通过优...

阿里云文档 2025-03-31

多集群舰队组件统一管理

ACK仅支持单集群的组件管理,您需手动维护各个集群中组件的版本,维护成本较高,也增加了由于组件升级引发的稳定性问题。ACK One舰队为集群运维人员提供了统一且自动化的组件管理能力,可以定义包含多个组件及其版本的基线,并将其部署到多个集群,同时支持组件配置、部署批次和回滚等功能,从而提升系统的稳定性。本文将介绍如何在多集群场景中统一安装和管理组件。

文章 2023-11-13 来自:开发者社区

redisTemplate+redis+lua解决redis分布式锁集群报错问题

单机环境redis+lua实现分布式锁没有问题生产环境是redis集群的,报错:EvalSha is not supported in cluster environment解决:package com.zuma.coupon.util; import com.zuma.common.utils.StringUtils; import org.slf4j.Logger; import org.s....

问答 2023-11-07 来自:开发者社区

企业级分布式应用服务EDAS在k8s集群中创建Java应用时,报错 详见截图 这是怎么回事

企业级分布式应用服务EDAS在k8s集群中创建Java应用时,报错 详见截图 这是怎么回事

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注