阿里云文档 2025-06-06

基于CPU指标的容器原地垂直伸缩

AVPA(ack-advanced-vertical-pod-autoscaler)是阿里云推出的柔性资源变配组件,在基于指标的垂直伸缩能力以外,还提供了应用启动加速能力。本文主要介绍基于CPU指标的垂直伸缩能力,从使用场景、具体的使用和配置方式以及使用限制进行介绍。

阿里云文档 2025-01-14

在Knative中使用HPA实现基于CPU和Memory的自动扩缩容

Knative和HPA(Horizontal Pod Autoscaler)的结合使用可以为您的应用提供基于资源负载的自动扩缩容能力。Knative本身已经提供了基于请求量的自动扩缩容功能,但通过结合HPA,您可以根据更多指标类型(例如CPU使用率、内存使用率等)进一步精细化控制扩缩容行为。

阿里云文档 2024-08-23

使用AMD AI容器镜像部署ChatGLM3-6B语言模型

本文以聊天机器人为例,介绍如何使用Alibaba Cloud AI Containers(简称AC2)提供的AI容器镜像在AMD CPU上部署ChatGLM3-6B语言模型。

问答 2024-08-05 来自:开发者社区

容器对CPU和内存的资源请求和限制分别是多少?

容器对CPU和内存的资源请求和限制分别是多少?

问答 2024-06-15 来自:开发者社区

容器服务ACK集群Pod申请CPU资源失败

容器服务ACK集群Pod申请CPU资源失败

阿里云文档 2024-05-10

使用Intel AI容器镜像部署通义千问Qwen-7B-Chat

本文聊天机器人为例,介绍如何使用Alibaba Cloud AI Containers(简称AC2)提供的AI容器镜像在Intel CPU上部署通义千问Qwen-7B-Chat。

文章 2024-05-07 来自:开发者社区

Docker详解(十一)——Docker容器CPU资源限额实战Docker详解

今天继续给大家介绍Linux运维相关知识,本文主要内容是Docker的CPU资源限额实战。 一、实战说明与环境准备在前文Docker详解(十)——Docker容器CPU资源限额配置中,我们介绍了对Docker容器进行资源限制的方式,在今天,我们就来对该文中介绍的限额方式进行检验。在本文中,我们使用s...

文章 2024-05-07 来自:开发者社区

Docker详解(十)——Docker容器CPU资源限额配置

今天继续给大家介绍Linux运维相关知识,本文主要内容是Docker的CPU资源限额配置。当我们在一台设备上运行多个Docker时,我们会对一个Docker容器的使用进行限制,避免其使用过多的系统硬件资源,而造成其他的容器“饿死”的现象。在Docker的使用中,我们通过使用cgroup来对Docker的容器资源使用进行限制。D...

阿里云文档 2024-02-27

在TDX节点池中使用CPU加速Stable Diffusion XL Turbo的文生图推理

您可以在ACK集群使用阿里云第八代企业级实例ECS g8i作为Worker节点,并结合IPEX技术来加速文生图模型的推理速度。您也可以在集群中创建TDX机密虚拟机节点池,并将示例服务迁移至其中,提升推理服务数据的安全性。本文以Stable Diffusion XL Turbo模型为例,介绍如何在合理运用CPU加速策略和模型推理的前提下,基于g8i CPU实例获得类似于GPU实例的使用体验,实现稳定...

文章 2022-08-25 来自:开发者社区

Koordinator 0.6:企业级容器调度系统解决方案,引入 CPU 精细编排、资源预留与全新的重调度框架

作者:李涛、曾凡松阿里云原生开源的混部系统 Koordinator 基于阿里超大规模混部生产实践经验而来,旨在为用户打造云原生场景下接入成本最低、混部效率最佳的解决方案,助力用户企业实现云原生后提升计算资源利用率、降低 IT 成本。经过社区多位成员的贡献,Koordinator 0.6 版本正式发布。相较于上一个版本 0.5[1],新版本进一步完善了 CPU 精细化编排能力,更好的兼容原生用法;....

Koordinator 0.6:企业级容器调度系统解决方案,引入 CPU 精细编排、资源预留与全新的重调度框架

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注