[帮助文档] 升级共享GPU调度组件ack-ai-installer

当您的集群已经安装共享GPU调度组件,但节点GPU驱动版本与集群中已存在的cGPU版本不兼容,或者节点操作系统版本与集群中已存在的cGPU版本不兼容时,您需要将共享GPU调度组件升级到最新版本。

函数计算容器为啥都不能配置gpu了?

函数计算容器为啥都不能配置gpu了?

云原生AI套件:一键训练大模型及部署GPU共享推理服务

1 课时 |
52 人已学 |
免费
开发者课程背景图

[帮助文档] 基于GPU指标实现弹性伸缩

Kubernetes提供了Custom Metrics机制,该机制可以对接阿里云Prometheus监控来采集GPU指标。本文介绍如何部署阿里云Prometheus监控,并结合示例说明如何通过阿里云Prometheus监控观测GPU指标,实现容器的弹性伸缩。

[帮助文档] 使用NVIDIA GPU部署AI容器镜像Qwen-7B-Chat

本文聊天机器人为例,介绍如何使用Alibaba Cloud AI Containers(简称AC2)提供的AI容器镜像在NVIDIA GPU上部署通义千问Qwen-7B-Chat。背景信息通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模模型。Qwen-7B是基于Tra...

[帮助文档] 在GPU实例的Docker环境中配置eRDMA功能实现容器应用程序的直接访问

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大规模数据传输和高性能网...

[帮助文档] 利用DCGM实现GPU的性能分析

NVIDIA GPU上存在一些硬件计数器,这些计数器可以用来收集一些设备级别的性能指标,例如GPU利用率、内存使用情况等。借助NVIDIA提供的NVML(NVIDIA Management Library)库或DCGM(Data Center GPU Manager)工具能够查询这些硬件层提供的指标...

函数计算GPU实例怎么通过容器镜像方式部署?

函数计算GPU实例怎么通过容器镜像方式部署?

【Hello AI】GPU容器共享技术cGPU

【Hello AI】GPU容器共享技术cGPU

GPU容器共享技术cGPU是阿里云基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。为什么选择cGPU兼容性好不仅适配标准的Docker和Containerd工作方式,而且还无缝兼容Kubernetes工作方式。操作简...

在阿里函数计算怎么申请开通GPU函数计算?为什么使用容器创建函数时无法选择GPU类型?

在阿里函数计算怎么申请开通GPU函数计算?为什么使用容器创建函数时无法选择GPU类型?

函数计算FC使用GPU实例, 跑网易开源的 emoti-voice 容器, 提示这个,啥原因导致的?

函数计算FC使用GPU实例, 跑网易开源的 emoti-voice 容器, 提示RuntimeError: CUDA error: no kernel image is available for execution on the device CUDA kernel errors might be...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

云服务器ECS
云服务器ECS
做技术先进、性能优异、稳如磐石的弹性计算!
418277+人已加入
加入
相关电子书
更多
端到端GPU性能在深度学学习场景下的应用实践
DeepStream: GPU加速海量视频数据智能处理
阿里巴巴高性能GPU架构与应用
立即下载 立即下载 立即下载

GPU云服务器容器相关内容