云原生 AI 套件中,阿里云的ack服务,部署的代码想要检测宿主机是否有GPU资源,这个有方案么?

云原生 AI 套件中,阿里云的ack服务,部署的代码想要检测宿主机是否有GPU资源,这个有方案么?

[帮助文档] 如何在ACK专有版集群中使用共享GPU调度

如您需要在ACK专有版集群中使用共享GPU调度基础版,请参见以下文档。ACK专有版集群基础版迁移专业版安装共享GPU调度组件运行共享GPU调度组件使用共享GPU调度实现仅共享不隔离能力使用共享GPU调度实现cGPU算力分配策略解决专业版集群升级共享GPU调度失效问题

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

如何在 ACK 中使用 MSE Ingress

1 课时 |
114 人已学 |
免费

从概念、部署到优化,Kubernetes Ingress 网关的落地实践

1 课时 |
188 人已学 |
免费
开发者课程背景图
基于ACK One注册集群实现IDC中K8s集群以Serverless方式使用云上CPU/GPU资源

基于ACK One注册集群实现IDC中K8s集群以Serverless方式使用云上CPU/GPU资源

在前一篇文章《基于ACK One注册集群实现IDC中K8s集群添加云上CPU/GPU节点》中,我们介绍了如何为IDC中K8s集群添加云上节点,应对业务流量的增长,通过多级弹性调度,灵活使用云上资源,并通过自动弹性伸缩,提高使用率,降低云上成本。 这种直接添加节点的方式,适合需要自定义配置节...

[帮助文档] 使用集群巡检和诊断的节点诊断功能自助排查GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点问题,并提供nvidia-smi和XID状态码排查列...

[帮助文档] 如何实现K8s集群以Serverless方式使用云上CPU/GPU资源

IDC中K8s集群通过Serverless方式使用阿里云弹性容器实例ECI运行业务Pod。您可以在K8s集群直接提交业务Pod,使Pod运行在ECI上,无需额外运维云上节点池,更加灵活、高效、弹性地使用云上CPU和GPU资源。本文介绍如何基于注册集群实现IDC中K8s集群以Serverless方式使...

基于ACK One注册集群实现IDC中K8s集群添加云上CPU/GPU节点

基于ACK One注册集群实现IDC中K8s集群添加云上CPU/GPU节点

在前一篇文章《基于ACK One注册集群轻松实现云上云下K8s集群统一管理》中,我们注重介绍了注册集群的应用场景,架构实现,安全加固,以及在他云K8s集群和IDC自建K8s集群中使用阿里云容器服务ACK的强大可观测性能力,实现云上云下K8s集群的统一运维管理。本文会重点介绍ACK ...

[帮助文档] 如何在ACK实现基于GPU指标的AHPA弹性预测

容器服务ACK支持AHPA(Advanced Horizontal Pod Autoscaler)的弹性预测能力,满足在应用具备周期性的情况下,通过弹性预测进行资源预热,解决您在服务使用中遇到的弹性滞后问题。AHPA支持多种指标预测,包括CPU、Memory、GPU和QPS等。本文介绍如何通过阿里云...

基于ACK One注册集群实现IDC中K8s集群添加云上CPU/GPU节点

基于ACK One注册集群实现IDC中K8s集群添加云上CPU/GPU节点

在前一篇文章《基于ACK One注册集群轻松实现云上云下K8s集群统一管理》中,我们注重介绍了注册集群的应用场景,架构实现,安全加固,以及在他云K8s集群和IDC自建K8s集群中使用阿里云容器服务ACK的强大可观测性能力,实现云上云下K8s集群的统一运维管理。本文会重点介绍ACK One注册集群的另...

[帮助文档] 如何在ACK灵骏托管版集群中使用共享GPU调度(eGPU)

本文介绍如何在ACK灵骏托管版集群中的灵骏节点上使用共享GPU调度(eGPU),实现GPU的调度和隔离能力。

如何使用 ACK 共享 GPU 调度| 学习笔记

如何使用 ACK 共享 GPU 调度| 学习笔记

开发者学堂课程【5分钟玩转阿里云容器服务:如何使用 ACK 共享 GPU 调度】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/1038/detail/18167如何使用 ACK 共享 GPU 调度&n...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234774+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK 加速企业应用现代化升级
容器服务 ACK – 智算时代的现代化应用平台
立即下载 立即下载 立即下载
相关镜像