阿里云文档 2026-03-23

采集ACS Pod的Prometheus Metrics指标

为了采集指定GPU-HPN节点或虚拟节点的Metrics数据,ACS在多个采集端点中提供了不同类型的指标。您可以通过修改Prometheus监控配置来采集目标节点的Metrics。

阿里云文档 2026-03-06

基于库存感知的跨地域多集群弹性调度

ACK One多集群舰队在多地域应用服务部署场景下,针对多地域资源调配的难题设计并实现了基于库存感知的智能调度器。本文介绍库存感知的工作原理以及如何开启和使用库存感知调度能力。

阿里云文档 2025-09-12

单集群应用迁移至舰队并分发到多集群

为解决应用多集群部署时的重复操作,易出错,难同步等问题,可使用AMC命令行工具将应用快速部署到多个集群,并实现后续统一管理和自动同步更新。

阿里云文档 2025-09-12

单集群应用迁移至舰队并分发到多集群

为解决应用多集群部署时的重复操作,易出错,难同步等问题,可使用AMC命令行工具将应用快速部署到多个集群,并实现后续统一管理和自动同步更新。

阿里云文档 2025-08-21

部署多机分布式推理服务

本文以Qwen3-32B模型为例,演示如何在ACK中使用vLLM框架及SGLang框架部署多机分布式模型推理服务。

文章 2025-04-16 来自:开发者社区

ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践

【阅读原文】戳:ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践 ACK Gateway with Inference Extension组件专为LLM推理场景设计,支持四层/七层流量路由,并提供基于模型服务器负载智能感知的负载均衡能力。此外,通过InferencePool和InferenceModel自定义资...

ACK Gateway with Inference Extension:优化多机分布式大模型推理服务实践
文章 2025-02-28 来自:开发者社区

大道至简-基于ACK的Deepseek满血版分布式推理部署实战

本文是基于阿里云容器服务产品ACK,部署Deepseek大语言模型推理服务系列文章的第二篇。将介绍如何在Kubernetes管理的GPU集群中,快速部署多机分布式Deepseek-R1 671B(“满血版”)推理服务。并集成Dify应用,构建一个简单的Deepseek问答助手。关于如何在ACK部署Deepseek“蒸馏版”模型推理服务,可以参考本系列第一篇文章《基于ACK的DeepSeek蒸馏模....

大道至简-基于ACK的Deepseek满血版分布式推理部署实战
文章 2025-02-13 来自:开发者社区

大道至简-基于ACK的Deepseek满血版分布式推理部署实战

【阅读原文】戳:大道至简-基于ACK的Deepseek满血版分布式推理部署实战 本文是基于阿里云容器服务产品ACK,部署Deepseek大语言模型推理服务系列文章的第二篇。将介绍如何在Kubernetes管理的GPU集群中,快速部署多机分布式Deepseek-R1 671B(“满血版”)推理服务。并集成Dify应用,构建一个简单的Deepseek问答助手。关于如何在A...

大道至简-基于ACK的Deepseek满血版分布式推理部署实战
文章 2024-12-11 来自:开发者社区

阿里云容器服务 ACK One 分布式云容器企业落地实践

阿里云容器服务ACK提供丰富的产品功能,在弹性、调度、可观测、成本治理、安全合规方面提供强大且成熟的产品能力,但如果您有IDC资源或者三方资源,无法短期迁移到阿里云容器服务ACK,又有弹性、调度、可观测、成本治理、安全等方面的痛点,可以考虑采用ACK  One分布式云容器平台。 3年前的云栖大会,我们发布分布式云容器平台ACK One,随着3年的发展,很高兴看到ACK...

阿里云容器服务 ACK One 分布式云容器企业落地实践
文章 2024-09-26 来自:开发者社区

阿里云容器服务 ACK One 分布式云容器企业落地实践

【阅读原文】戳:阿里云容器服务 ACK One 分布式云容器企业落地实践 阿里云容器服务ACK提供丰富的产品功能,在弹性、调度、可观测、成本治理、安全合规方面提供强大且成熟的产品能力,但如果您有IDC资源或者三方资源,无法短期迁移到阿里云容器服务ACK,又有弹性、调度、可观测、成本治理、安全等方面的痛点,可以考虑采用ACK One分布式云容器平台。  ...

阿里云容器服务 ACK One 分布式云容器企业落地实践

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注