阿里云文档 2025-04-27

ACK Edge发布Kubernetes 1.32版本说明

阿里云容器服务 Edge 版是基于容器服务 Kubernetes 版 ACK(Container Service for Kubernetes),面向边缘场景的云边一体化托管方案。本文介绍ACK Edge集群发布Kubernetes 1.32版本的变更内容。

阿里云文档 2025-04-02

基于ACK集群的Dify组件升级指南

本文主要指导用户将ack-dify从旧版本升级至v1.0.0及以上,首先备份数据,然后通过命令提取并安装插件迁移工具至插件系统,最后验证插件功能是否正常运行,以启用新的插件生态系统。

阿里云文档 2025-04-02

通过SLS CRD采集日志

本文介绍在ACK One注册集群中,如何通过SLS CRD来配置日志采集,实现通过阿里云日志服务SLS自动采集ECI容器日志。

阿里云文档 2025-04-01

基于ACK One与云效快速构建多集群CD

云效是阿里云提供的一站式DevOps平台,涵盖软件研发全生命周期的工具链和服务管理,可以通过流水线Flow将应用部署到ACK集群中。分布式云容器平台ACK One的应用分发功能可以根据多样的策略(静态权重、动态资源调度、Gang调度等)将Kubernetes资源灵活分配到多个集群,并具备重调度和故障迁移等能力。结合云效自身的CD能力和ACK One的应用分发功能,您可以快速将单集群持续交付构建成多...

阿里云文档 2025-04-01

如何通过环境变量采集日志

ECI支持通过容器的环境变量传入日志相关的自定义配置。本文介绍如何通过环境变量来配置日志采集,实现通过阿里云日志服务SLS自动采集容器日志。

文章 2022-02-17 来自:开发者社区

尝鲜阿里云容器服务Kubernetes 1.16,共享TensorFlow实验室《二》--共享GPU的弹性

上一篇文章《尝鲜阿里云容器服务Kubernetes 1.16,共享TensorFlow实验室》我们讲述了如何通过CGPU的方案来实现CGPU资源的共享和隔离。本文介绍基于CGPU资源的弹性能力。ps:下面的说明是基于上一篇文章的环境来进行的描述,环境的搭建请参考上一篇文章。 配置弹性伸缩组 在“集群列表”中目标集群的“更多”的下拉菜单中选中“自动伸缩” 配置基础的“缩容规则”后,“创建伸缩组...

尝鲜阿里云容器服务Kubernetes 1.16,共享TensorFlow实验室《二》--共享GPU的弹性
文章 2022-02-17 来自:开发者社区

体验托管Prometheus监控阿里云容器服务Kubernetes的GPU资源

在阿里云容器服务中使用GPU资源运行进行AI模型训练和预测时,经常需要了解应用负载的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,通过内置ARMS可以从应用的维度去观测GPU的使用情况,了解资源水位,以及设定相应的报警,避免因为GPU资源的约束引发业务风险。另外相比自建的Prometheus方案, ARMS的全面托管的 Prometheus 服务可以提供以下特性,....

体验托管Prometheus监控阿里云容器服务Kubernetes的GPU资源
文章 2022-02-17 来自:开发者社区

阿里云容器服务Kubernetes 基于GPU指标自动伸缩

基于GPU的指标扩缩容 在深度学习训练中,训练完成的模型,通过Serving服务提供模型服务。本文介绍如何构建弹性自动伸缩的Serving服务。 Kubernetes 支持HPA模块进行容器伸缩,默认支持CPU和内存等指标。原生的HPA基于Heapster,不支持GPU指标的伸缩,但是支持通过CustomMetrics的方式进行HPA指标的扩展。我们可以通过部署一个基于Prometheus Ad....

阿里云容器服务Kubernetes 基于GPU指标自动伸缩
文章 2022-02-17 来自:开发者社区

基于阿里云容器服务监控 Kubernetes集群GPU指标

简介当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,本文介绍如何快速在阿里云上构建基于Prometheus + Grafana的GPU监控方案。PrometheusPrometheus 是一个开源的服务监控系统和时间序列数据库。从 2012 年开始编写....

基于阿里云容器服务监控 Kubernetes集群GPU指标
文章 2022-02-16 来自:开发者社区

尝鲜阿里云容器服务Kubernetes 1.9,拥抱GPU新姿势

尝鲜阿里云容器服务Kubernetes, 拥抱Nvidia GPU的新姿势 自从1.8版本开始,Kubernetes已经明确表示要通过统一的设备插件方式支持像Nvidia PU,InfiniBand,FPGA等硬件加速设备,而社区的GPU方案将在1.10全面弃用,并在1.11版本彻底从主干代码移除。 而Kubernetes全新的GPU调度方案基于Nvidia官方的设备插件和nvidia-cont....

尝鲜阿里云容器服务Kubernetes 1.9,拥抱GPU新姿势

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注