文章 2022-09-09 来自:开发者社区

阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误

XID错误消息是NVIDIA驱动报告的错误信息,一般会将错误消息记录在/var/log/messages(或使用dmesg -T查看),如果一个节点有XID错误消息,说明节点发生了与GPU有关的错误,这个错误有可能是由于GPU硬件故障引起,也有可能是软件问题引起的(比如:...

阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误
文章 2022-09-09 来自:开发者社区

阿里云容器服务GPU监控2.0进阶篇2:学会剖析(Profiling)您的GPU使用情况

本系列相关文章:阿里云容器服务GPU监控2.0基础篇1:基本功能使用阿里云容器服务GPU监控2.0基础篇2:监控NVLINK带宽阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误阿里云容器服务GPU监控2.0进阶篇1:剖析(Profiling)GPU使用情况必备知识阿里云容器服务G...

阿里云容器服务GPU监控2.0进阶篇2:学会剖析(Profiling)您的GPU使用情况
文章 2022-09-09 来自:开发者社区

阿里云容器服务共享GPU调度支持算力分配

ACK Pro集群支持为应用申请GPU显存和算力,能够帮助您更精细化的使用GPU的显存和算力资源。本文介绍如何使用算力分配功能。前提条件已创建ACK Pro版集群,且集群版本为1.20.11。关于Kubernetes的升级操作,请参见升级ACK集群K8s版本。已安装共享GPU组件,且Chart版本>1.2.0。关于安装共享GPU组件的...

阿里云容器服务共享GPU调度支持算力分配
文章 2022-09-09 来自:开发者社区

阿里云轻量容器服务详解之什么是轻量应用服务器的容器服务?

阿里云轻量应用服务器的容器服务是为学生和个人开发者打造的轻量级容器服务,如果你想学习容器和K8s,那么可以选择轻量容器服务,通过容器服务可以快速了解云上容器和Kubernetes(简称K8s)相关基础概念和入门实践。阿里云百科来详细说下轻量应用服务器的容器服务以及容器服务配置和价格:什么是轻量服务器的容器服务?轻量容器服务提供了一种在云中运行容器化应用程序的简单方法,使用容器服务中的容器镜像可以....

阿里云轻量容器服务详解之什么是轻量应用服务器的容器服务?
问答 2022-08-25 来自:开发者社区

阿里云容器服务平台主要包括哪两种网络模式?

阿里云容器服务平台主要包括哪两种网络模式?

文章 2022-08-25 来自:开发者社区

开发者测评:阿里云 ACR 与其他的镜像仓库到底有什么不同?

最近,阿里云容器镜像服务 ACR 开发者评测活动正在火热开展中。阿里云容器镜像服务 ACR(Alibaba Cloud Container Registry)是面向容器镜像、Helm Chart 等符合 OCI 标准的云原生制品安全托管及高效分发平台。产品分为个人版和企业版,个人版面向容器开发者限额免费使用。为了帮助更多开发者了解容器镜像服务 ACR 的功能、使用方式和产品体验,阿里云容器镜像 ....

开发者测评:阿里云 ACR 与其他的镜像仓库到底有什么不同?
文章 2022-08-24 来自:开发者社区

CSDN 报告:阿里云容器服务成为中国开发者首选

最近,国内知名 IT 技术社区 CSDN  重磅发布《2021-2022 中国开发者调查报告》,旨在全面和深入地了解中国开发者群体整体现状、应用开发技术以及开发工具、平台的状况和发展趋势。该报告对近万名开发者进行调研,“云原生”首次作为独立章节出现在年度报告中,已发展为反映中国开发技术发展变化趋势的关键领域。企业云原生投入加大,阿里云容器服务成为开发者首选调查显示,云原生已发展为驱动业....

CSDN 报告:阿里云容器服务成为中国开发者首选
文章 2022-08-24 来自:开发者社区

阿里云 ACK 容器服务生产级可观测体系建设实践

作者:冯诗淳(行疾)ACK 可观测体系介绍全景概要介绍上图为 ACK 可观测体系全景图金字塔,从上至下可分为四层:最上层是最接近用户业务的 Business Monitoring,包括用户业务的前端的流量、PV、前端性能、JS 响应速度等监控。通过容器服务的 IngressDashboard 来监测 Ingress 的请求量以及请求的状态,用户可以定制业务日志,通过容器服务的日志监控来实现业务的....

阿里云 ACK 容器服务生产级可观测体系建设实践
文章 2022-08-23 来自:开发者社区

【有奖评测局】阿里云容器镜像 ACR 测评团限时招募中!​

随着云原生技术的普及,业务负载上容器越来越普遍。特别是在企业级环境下,越来越多的开发者在进行容器镜像仓库的选型时,都会面临官方镜像版本无法满足功能需求、传统构建方式镜像体积越来越大、镜像下载时受到网络环境的影响、镜像内存在的漏洞无法规避等诸多需要解决的问题。阿里云容器镜像服务 ACR(Alibaba Cloud Container Registry)是面向容器镜像、Helm Chart 等符合 ....

【有奖评测局】阿里云容器镜像 ACR 测评团限时招募中!​
文章 2022-08-22 来自:开发者社区

阿里云容器服务 ACK 产品技术动态(202207)

容器服务 ACK【集群运维】Feature:集群任务活动审计页上线ACK 集群上线任务活动审计页,用户可以在集群详情-集群任务查看。该页记录集群操作、节点池操作、组件相关操作的日志,用于事后审计。Feature:ACK 支持差异化 SLO 能力ACK 上线 ack-slo-manager 组件,支持差异化 SLO(Service Level Objectives)能力,支持将不同类型的工作负载混....

阿里云容器服务 ACK 产品技术动态(202207)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐