阿里云文档 2026-06-07

通过docker run --gpus all [镜像名称]启动容器镜像时出现docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].报错

在GPU云服务器上安装Docker环境后,如果未安装NVIDIA Container Toolkit,通过docker run --gpus all [镜像名称]启动容器镜像时,可能会出现docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]报错,本文为您介绍这...

阿里云文档 2026-04-16

在GPU实例的Docker环境中快速配置eRDMA提升网络性能

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大规模数据传输和高性能网络通信的应用场景。本文介绍如何使用eRDMA镜像在GPU实例上快速配置eRDMA。

阿里云文档 2025-11-06

在Docker容器中使用eRDMA实现应用程序直接访问物理设备提升数据传输和通信效率

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大规模数据传输和高性能网络通信的应用场景。本文主要介绍如何在容器(Docker)中配置eRDMA,以及在自建k8s集群上如何...

文章 2025-10-07 来自:开发者社区

如何在Kubernetes环境下使用第三方监控系统监控Docker容器性能?

在Kubernetes(K8s)环境下监控Docker容器性能,需结合K8s的集群特性(如Pod、Deployment、Node架构)与第三方监控系统,实现“容器- Pod - Node - 集群”多层级的指标采集、可视化与告警。以下是基于主流第三方工具的完整实现方案,覆盖开源与商业选型࿰...

文章 2025-10-07 来自:开发者社区

如何使用第三方监控系统监控Docker容器性能?

使用第三方监控系统监控Docker容器性能,能实现更全面的指标采集、可视化分析和告警功能,尤其适合生产环境中大规模容器集群的管理。以下是基于主流第三方工具的具体实现方案: 一、核心监控目标 在选择工具前,需明确监控维度: 容器基础资源:CPU使用率、内存占用、磁盘I/O、网络吞吐量。 容器状态:...

文章 2024-06-16 来自:开发者社区

性能监控之 JMX 监控 Docker 容器中的 Java 应用

一、前言 今天在配置 docker 和 JMX 监控的时候,看到有一个细节和非容器环境中的 JMX 配置不太一样。所以在这里写一下,以备其他人查阅。 二、遇到的问题 1、问题现象 一般情况下,我们配置 JMX 只要写上下面这些参数就可以了。 以下是无密码监控时的 JMX 配置参数(有密码监控的配置和常规监控无异) -Dcom.sun.management.jmxremote -Dco...

性能监控之 JMX 监控 Docker 容器中的 Java 应用
问答 2024-05-30 来自:开发者社区

ARMS是否支持直接监控docker容器

ARMS是否支持直接监控docker容器

阿里云文档 2023-11-15

如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享

本文以卷积神经网络模型ResNet50的训练和推理为例,为您介绍如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享。本实践中的ResNet50模型基于NVIDIA官方开源代码DeepLearningExamples实现。

阿里云文档 2023-09-03

[产品变更]从DockerHub拉取镜像速度变慢的公告_容器服务Kubernetes版(ACK)

近期由于运营商网络问题导致从Docker Hub拉取镜像速度变慢,建议您将镜像上传至ACR,或者订阅海外源镜像。具体操作如下: 关于上传镜像至ACR的具体操作,请参见使用企业版实例推送和拉取镜像。 关于订阅海外源镜像的具体操作,请参见订阅海外源镜像。关于上传镜像至ACR的具体操作,请参见使用企业版实...

文章 2023-01-31 来自:开发者社区

远见而明察近观若明火|Centos7.6环境基于Prometheus和Grafana结合钉钉机器人打造全时监控(预警)Docker容器服务系统

我们知道,奉行长期主义的网络公司,势必应在软件开发流程管理体系上具备规范意识,即代码提交有CR(CodeReview),功能测试上自动化,而功能发布讲究三板斧:灰度、监控、止血。灰度属于测试范畴,止血则是亡羊补牢,今天我们来聊聊监控,提起监控,就不得不提在DepOps(自动化运维)领域鼎鼎有名的Prometheus(普罗米修斯),有人说这个开源系统的名字怎么有点如雷贯耳啊,没错,它的名字就是取自....

远见而明察近观若明火|Centos7.6环境基于Prometheus和Grafana结合钉钉机器人打造全时监控(预警)Docker容器服务系统

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注