阿里云文档 2025-04-22

基于eRDMA部署3FS高性能分布式存储集群

3FS是深度求索(DeepSeek)公司自主研发的高性能分布式存储系统,专为AI大模型训练、大数据分析及高性能计算(HPC)场景优化设计。在3FS中,融合现代SSD存储与RDMA网络技术,突破传统网络的性能瓶颈。本文介绍如何基于阿里云自研的云上弹性RDMA网络部署3FS集群,实现低延迟与高吞吐数据传输,支撑AI训练和大规模数据分析的高性能需求。

阿里云文档 2025-04-07

集群巡检

本文介绍EDAS对K8s集群的集群巡检功能,旨在指导您完成集群巡检功能的相关操作,包括手动触发巡检、设置周期性自动触发巡检,并提供查看下载巡检报告的相关配置步骤和注意事项。

阿里云文档 2025-04-01

基于ACK One与云效快速构建多集群CD

云效是阿里云提供的一站式DevOps平台,涵盖软件研发全生命周期的工具链和服务管理,可以通过流水线Flow将应用部署到ACK集群中。分布式云容器平台ACK One的应用分发功能可以根据多样的策略(静态权重、动态资源调度、Gang调度等)将Kubernetes资源灵活分配到多个集群,并具备重调度和故障迁移等能力。结合云效自身的CD能力和ACK One的应用分发功能,您可以快速将单集群持续交付构建成多...

阿里云文档 2025-04-01

基于实际剩余资源的多集群Spark作业调度与分发

如果您已经拥有多个正在运行在线服务的ACK集群,并希望在不影响这些服务的情况下,充分利用集群的空闲资源来运行Spark作业,您可以利用ACK One舰队的多集群Spark作业调度和分发能力来提高资源利用率。本文将介绍如何通过ACK One舰队和ACK Koordinator组件,根据各集群实际剩余资源(而非请求资源)来调度和分发多集群Spark作业,帮助您最大化多集群中闲置资源的利用效率,并通过优...

阿里云文档 2025-03-31

多集群舰队组件统一管理

ACK仅支持单集群的组件管理,您需手动维护各个集群中组件的版本,维护成本较高,也增加了由于组件升级引发的稳定性问题。ACK One舰队为集群运维人员提供了统一且自动化的组件管理能力,可以定义包含多个组件及其版本的基线,并将其部署到多个集群,同时支持组件配置、部署批次和回滚等功能,从而提升系统的稳定性。本文将介绍如何在多集群场景中统一安装和管理组件。

文章 2024-06-03 来自:开发者社区

负载均衡与容错性:集群模式在分布式系统中的应用

大家好,我是小米,一个热爱分享技术的29岁程序员。今天我们来聊一聊分布式系统中的一个重要概念:集群(Cluster)模式。相信很多朋友在日常开发中都接触过集群,但对它的内部机制和实现细节可能了解不深。没关系,今天我们就深入探讨一下这个话题,希望能帮助大家更好地理解和应用集群模式。 什么是集群模式? 简单来说,集群模式就是将多个服务器节点组合在一起,形成一个整体,共同提供服务。这些...

负载均衡与容错性:集群模式在分布式系统中的应用
文章 2023-01-18 来自:开发者社区

Sealer 0.9 :帮助集群和分布式应用实现 Build、 Share、Run

作者:sealer 社区新春之际,很高兴在此时宣布 Sealer[1] 0.9 版本的正式发布。Sealer 是一款致力于探索面向分布式应用的快速打包、交付和运行的解决方案。2021 年5月 Sealer 项目正式开源;短短一年时间,Sealer 在 2022 年 4 月成为 CNCF Sandbox 项目。Sealer 0.9 版本中,其在核心定位上由专注 “集群维度的 Build,Share....

Sealer 0.9 :帮助集群和分布式应用实现 Build、 Share、Run

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注