[帮助文档] 在ACK集群部署多租户任务调度管理

在ACK集群中,企业可以通过AI套件中的任务管理工具Arena、队列调度管理系统Kube Queue、配额管理工具ElasticQuotaTree以及Prometheus监控打造企业级任务调度系统。本文将从实际案例出发自底而上地介绍如何基于ACK集群构建一个任务调度系统。

[帮助文档] 利用DCGM实现GPU的性能分析

NVIDIA GPU上存在一些硬件计数器,这些计数器可以用来收集一些设备级别的性能指标,例如GPU利用率、内存使用情况等。借助NVIDIA提供的NVML(NVIDIA Management Library)库或DCGM(Data Center GPU Manager)工具能够查询这些硬件层提供的指标...

云原生可观测最佳实践

1 课时 |
39 人已学 |
免费

阿里云云原生助理工程师认证(ACA)课程

66 课时 |
214 人已学 |
免费

高校精品课-华东师范大学-云原生数据库

13 课时 |
277 人已学 |
免费
开发者课程背景图

[帮助文档] 使用抢占式实例弹性训练以降低AI模型的训练成本

为降低使用AI模型训练成本,云原生AI套件推出基于抢占式实例的弹性训练解决方案,该方案可以将AI模型训练这种有状态类型的工作负载运行在抢占式实例上,几乎可以做到在不影响训练作业成功率的情况下降低训练成本。

[帮助文档] 如何升级ack-fluid组件

ack-fluid是云原生AI套件的数据缓存加速组件。当集群的ack-fluid组件版本为v1.0.6及以下,且攻击者拥有创建和修改Dataset和JuiceFSRuntime权限时,CRD资源可能被恶意修改,导致脚本注入,继而引起节点提权的安全风险。为提高安全性,建议您将ack-fluid组件升级...

云原生 AI 套件这个问题怎么解决?

云原生 AI 套件这个问题怎么解决?

部署云原生AI套件,这个会占用ack集群的资源吗?

部署云原生AI套件,这个会占用ack集群的资源吗?

在云原生 AI 套件下列情况在收费时,“用量(账号维度当日最大值)”是多少?

在云原生 AI 套件假如我运行任务A,跑了1个小时,用了5个GPU服务A完成后,运行任务B,跑了2个小时,用了10个GPU那么在收费时,“用量(账号维度当日最大值)”是多少?

云原生 AI 套件租用阿里云 ecs gpu ,放到阿里云ack就不行了,提示驱动没安装,为什么?

云原生 AI 套件租用阿里云 ecs gpu ,docker 能跑在 nvidia -gpu上跑,放到阿里云 ack 就不行了,提示驱动没安装,这一般是什么原因?

云原生 AI 套件参数错误怎么解决?

云原生 AI 套件参数错误怎么解决?kubectl apply -f bloom-vllm.yamlerror: error parsing bloom-vllm.yaml: error converting YAML to JSON: yaml: line 13: did not find exp...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"productCardStyle","productCode":"polardb","productCardInfo":{"productTitle":"云原生数据库 PolarDB PostgreSQL 版","productDescription":"阿里云自研数据库 PolarDB PostgreSQL,100%兼容 PostgreSQL,高度兼容 Oracle。为用户提供快速弹性、高性能、海量存储、安全可靠的数据库服务,同时支持阿里云自研 Ganos 多维多模时空信息引擎及开源 PostGIS 地理信息引擎。","productContentLink":"https://www.aliyun.com/product/apsaradb/polardbpg","isDisplayProductIcon":true,"productButton1":{"productButtonText":"了解详情","productButtonLink":"https://www.aliyun.com/product/apsaradb/polardbpg"},"productButton2":{"productButtonText":"管理控制台","productButtonLink":"https://polardb.console.aliyun.com/cn-hangzhou/clusters?spm=5176.28041490.J_5253785160.4.340b5820H6ZQUA"},"productButton3":{"productButtonText":"在线咨询","productButtonLink":"https://www.aliyun.com/core/online-consult?spm=5176.8789780.7y9jhqsfz.115.47ea55caeL2Mfu&from=OVtXEBmlH8"},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"最新活动","productPromotionInfoFirstText":"新用户3个月免费试用","productPromotionInfoFirstLink":"https://free.aliyun.com/?searchKey=PolarDB%20PostgreSQL","productPromotionInfoSecondText":"3月采购季限时优惠","productPromotionInfoSecondLink":"https://www.aliyun.com/activity/2024purchase/database"},{"$id":"1","productPromotionGroupingTitle":"快速入门","productPromotionInfoFirstText":"产品介绍","productPromotionInfoFirstLink":"https://help.aliyun.com/product/172538.html","productPromotionInfoSecondText":"快速入门","productPromotionInfoSecondLink":"https://help.aliyun.com/document_detail/139507.html"},{"$id":"2","productPromotionGroupingTitle":"最佳实践","productPromotionInfoFirstText":"AIGC 构建企业专属 chatbot","productPromotionInfoFirstLink":"https://help.aliyun.com/zh/polardb/polardb-for-postgresql/build-enterprise-specific-chatbot-based-on-polardb-postgresql-and-llm?spm=a2c4g.11186623.0.0.5ca81ad5VNjj3e","productPromotionInfoSecondText":"","productPromotionInfoSecondLink":""},{"$id":"3","productPromotionGroupingTitle":"产品推荐","productPromotionInfoFirstText":"PolarDB MySQL 版","productPromotionInfoFirstLink":"https://www.aliyun.com/product/apsaradb/polardbm","productPromotionInfoSecondText":"PolarDB 分布式版","productPromotionInfoSecondLink":"https://www.aliyun.com/product/apsaradb/polardbx"}]},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock"}}

社区圈子

阿里云云原生
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
9147+人已加入
加入
相关电子书
更多
阿里云云原生开源开发者沙龙北京站 PPT 合集
PolarDB开发者大会:PolarDB云原生弹性演进
2022云栖大会:云原生数据仓库-加速业务数据化,数据价值化
立即下载 立即下载 立即下载