GPU云服务器

GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。

什么是GPU云服务器

GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。为什么选择GPU云服务器 ...

产品优势

阿里云GPU云服务器具有领先的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式。覆盖范围领先 阿里云GPU云服务器在全球17个地域实现规模部署,具备全球领先的覆盖范围,结合弹性供应、弹性伸缩等交付方式,能够很好地满足您业务...

阿里异构计算产品总览

什么是异构计算 异构计算(Heterogeneous Computing)是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式,目前主要包括GPU云服务器、FPGA云服务器和弹性加速计算实例EAIS等。异构计算能够让最适合的专用硬件去服务最适合的...

API参考

如果您熟悉网络服务协议和一种以上编程语言,推荐您...GPU云服务器适用的API和云服务器ECS一致,详情请参见ECS API简介和ECS API概览。说明 GPU云服务器不支持使用预留实例券。icmsDocProps={'productMethod':'created','language':'zh-CN',};

常见问题

本章节汇总了使用GPU云服务器时的常见问题。为什么Windows操作系统不支持DirectX等功能?GPU实例支持安卓模拟器吗?我能变更GPU实例的配置吗?按量付费GPU实例支持节省停机模式吗?如何查看GPU监控数据?如何在GPU实例和普通ECS实例间传输...

应用场景

GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景。直播实时视频转码 阿里云异构GPU和FPGA服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务天猫双11...

GPU AI模型训练最佳实践

本方案适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。实现的方式 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练服务加速训练。使用Arena一键提交...

基本概念

本文汇总使用GPU云服务器过程中涉及的基本概念,方便您查询和了解相关概念。GPU云服务器概念 名词 说明 相关文档 GPU 图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。...

应用配置管理 ACM

应用配置管理(Application Configuration Management,简称 ACM),是一款在分布式架构环境中对应用配置进行集中管理和推送的工具类产品。基于该产品,您可以在微服务、DevOps、大数据等场景下极大地减轻配置管理的工作量,增强配置管理的...

配置审计

配置审计是一项面向资源的审计服务。在面对大量资源时,配置审计可以帮助您实现持续的基础设施的合规监管。

GPU监控

本文为您介绍如何通过监控控制台和API查询GPU监控数据。前提条件 请确保您已在服务器ECS上创建GPU计算型实例,且已安装GPU驱动。具体操作,请参见创建未配备驱动的GPU实例。请确保您已在服务器ECS上安装监控插件。具体操作,请参见...

RAPIDS加速图像搜索最佳实践

本方案适用于使用RAPIDS加速平台和GPU云服务器来对图像搜索任务进行加速的场景。相比CPU,利用GPU+RAPIDS在图像搜索场景下可以取得非常明显的加速效果。解决的问题 搭建RAPIDS加速图像搜索环境。使用容器服务Kubernetes版部署图像搜索环境...

RAPIDS加速机器学习最佳实践

本方案适用于使用RAPIDS加速库和GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU和RAPIDS在某些场景下可以取得非常明显的加速效果。解决的问题 搭建RAPIDS加速机器学习环境。使用容器服务Kubernetes版部署R...

应用场景

配置:T4 GPU。进行了如下性能优化,将性能提升至原来的2.7倍。视频解码移植到GPU。前后处理移植到GPU。自动凑满一次运算所需的数据集大小。卷积的深度优化。图像合成在线推理 模型:GAN模型。配置:T4 GPU。进行了如下性能优化,将性能...

使用ACK服务实现GPU成本优化

GPU服务器 GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。更多关于GPU服务器的介绍,请参见GPU服务器产品详情页。容器服务 ACK 容器服务Kubernetes版(ACK)提供高性能可伸缩的容器...

阿里异构计算产品总览

什么是异构计算 异构计算(Heterogeneous Computing)是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式,目前主要包括GPU云服务器、FPGA云服务器和弹性加速计算实例EAIS等。异构计算能够让最适合的专用硬件去服务最适合的...

NVIDIA驱动安装指引

相关操作指引如下:创建未配备驱动的GPU实例 在GPU计算型实例中安装GPU驱动(Linux)Windows操作系统(Windows Server)GPU驱动 目前暂时不支持通过创建GPU实例自动配置Windows操作系统的GPU驱动,您可以先创建未配备驱动的GPU实例,再前往...

GPU计算型

主售(推荐类型)GPU计算型实例规格族gn7i GPU计算型实例规格族gn7 GPU计算型实例规格族gn6i GPU计算型实例规格族gn6e GPU计算型实例规格族gn6v GPU计算型弹性裸金属服务器实例规格族ebmgn7i GPU计算型弹性裸金属服务器实例规格族ebmgn7 ...

使用AIACC-Training(AIACC训练加速)加速BERT Fine...

本方案适用于自然语言训练场景,使用GPU云服务器和极速型NAS进行BERT Finetune模型训练,使用AIACC-Training(AIACC训练加速)可以有效提升多机多卡的训练效率。实现的方式 使用GPU云服务器搭建训练环境。使用极速型NAS存储共享训练数据。...

GPU计算型实例中安装GPU驱动(Windows)

由于目前暂不支持通过创建GPU实例自动配置Windows操作系统的GPU驱动,为保证您能正常使用所创建的GPU实例,需要在创建实例后前往NVIDIA官网获取GPU驱动并手动安装。本文为您提供详细操作指导。背景信息 GPU实例仅支持安装与其操作系统一致...

创建配备GPU驱动的GPU实例(Linux)

背景信息 阿里目前仅支持在创建GPU计算型实例(如GPU计算型实例、GPU计算型弹性裸金属服务器实例)并选择了Linux操作系统的公共镜像时,配置自动安装GPU驱动,不适用于以下场景:如果您需要购买Windows操作系统的实例及GPU驱动,请购买未...

新功能发布记录

2019-03-19 全部 实例规格族 2018年9月 功能名称 功能描述 发布时间 发布地域 相关文档 实例规格族 最新一代GPU云主机gn6v(V100机型)正式售卖。2018-09-12 全部 实例规格族 2018年3月 功能名称 功能描述 发布时间 发布地域 相关文档 GPU...

什么是GPU容器共享技术cGPU

GPU容器共享技术cGPU是阿里首创的基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。为什么选择cGPU 更加开放 适配开源标准的Kubernetes和NVIDIA Docker...

GPU虚拟化型

本文介绍服务器ECS GPU虚拟化型实例规格族的特点,并列出了具体的实例规格。主售(推荐类型)GPU虚拟化型实例规格族vgn7i-vws GPU虚拟化型实例规格族vgn6i 在售(如果售罄,建议使用主售的规格族)GPU虚拟化型实例规格族vgn5i GPU虚拟化...

使用FastGPU进行极速AI训练

选用的产品 GPU服务器 GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。更多关于GPU服务器的介绍,请参见GPU服务器产品详情页。文件存储CPFS 文件存储CPFS(Cloud Parallel File ...

异构计算产品最佳实践概览

GPU云服务器 在GPU实例上部署NGC环境以搭建TensorFlow深度学习框架为例,介绍如何在GPU实例上部署NGC环境。GPU AI模型训练最佳实践适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行AI...

卸载GPU驱动

您可以手动卸载GPU驱动,卸载命令需要根据GPU驱动的安装方式和操作系统类型而定。背景信息 本文步骤均需要以root用户登录并进行操作。如果您是普通用户,请使用sudo命令获取root权限后再操作。如果您是通过创建GPU实例自动安装了GPU驱动,...

产品优势

GPU容器共享技术cGPU拥有节约成本和可灵活分配资源的优势,从而实现您业务的安全隔离。节约成本 随着显卡技术的不断发展,半导体制造工艺的进步,单张GPU卡的算力越来越强,同时价格也越来越高。但在很多的业务场景下,一个AI应用并不需要...

执行平台配置检查

安全中心的平台配置检查功能支持检查您产品中是否存在配置上的风险。本文介绍了如何在安全中心对平台配置执行即时手动检查,及设置检查周期进行周期性自动检查。背景信息 安全中心支持手动立即检查和周期性自动检查平台配置...

更新NVIDIA驱动

如果您需要安装GPU驱动,不同操作系统对应的操作指引如下:在GPU计算型实例中安装GPU驱动(Windows)在GPU计算型实例中安装GPU驱动(Linux)如果您需要安装GRID驱动,不同操作系统对应的操作指引如下:在GPU虚拟化型实例中安装GRID驱动...

GPU实例上部署NGC环境

本文以搭建TensorFlow深度学习框架为例介绍如何在GPU实例上部署NGC环境。前提条件 注册阿里账号,并完成实名认证。具体步骤,请参见注册阿里账号和实名认证。登录NGC网站,注册NGC账号。登录NGC网站,获取NGC API key并保存到本地。...

通过ACK安装并使用cGPU服务

本文为您介绍如何通过阿里容器服务Kubernetes版ACK(Container Service for Kubernetes)安装及使用GPU容器共享技术cGPU。安装cGPU服务 通过ACK服务在GPU节点上安装GPU隔离模块及GPU分配查询工具,从而实现GPU的调度和隔离能力。具体操作...

创建未配备驱动的GPU实例

如果您仅需要购买未配备驱动的普通GPU实例,可以参考本文操作指导创建GPU实例,但为了不影响您的使用,请务必在创建完成后手动安装相关驱动。背景信息 本文适用于以下场景:已经通过NVIDIA官网或其他渠道获取了GRID License及驱动。想要...

产品计费

GPU云服务器定价相关功能与云服务器ECS一致,本文为您介绍相关的概念和操作。计费项 计费项 说明 实例规格计费 即实例规格涉及的计算资源费用(包括vCPU和内存)。同一实例规格在不同地域的价格可能不同,具体请参见云服务器ECS定价页。...

查看和处理平台配置检查结果

本文介绍如何在安全中心查看并处理平台配置检查结果,具体包括检查项、检查项详情描述、可能产生的影响和处理建议。您可以在平台配置检查页面集中处理检查出来的风险配置项。前提条件 已执行平台配置检查。具体操作,请参见执行...

通过Docker安装并使用cGPU服务

返回示例如下所示:GPU 0:Tesla T4(UUID:GPU-b084ae33-e244-0959-cd97-83*)GPU 1:Tesla T4(UUID:GPU-3eb465ad-407c-4a23-0c5f-bb*)GPU 2:Tesla T4(UUID:GPU-2fce61ea-2424-27ec-a2f1-8b*)GPU 3:Tesla T4(UUID:GPU-22401369-db12-c6ce-fc48-...

部署GPU云服务器

新建空白应用,构建如下图所示的包含GPU云服务器实例的应用架构:本文所选地域为华北2(北京)可用区H。双击GPU实例,配置相关参数。参考创建GPU实例,选择对应的实例规格、镜像及版本。需要修改自定义登录密码。在实例自定义数据处,输入...

创建配备GRID驱动的GPU实例(Windows)

步骤2:完成网络和安全组配置 网络和安全组配置提供了公网以及与其他阿里资源通信的能力,并保障实例在网络中的安全。完成网络和安全组配置后,单击下一步:系统配置。选择网络及公网IP。配置项 说明 相关文档 网络 选择专有网络。专有...
< 1 2 3 4 ... 200 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折