使用Megatron-Deepspeed训练GPT-2并生成文本

本文介绍如何使用GPU云服务器,使用Megatron-Deepspeed框架训练GPT-2模型并生成文本。背景信息 GPT-2模型是OpenAI于2018年在GPT模型的基础上发布的新的无监督NLP模型,当时被称为“史上最强通用NLP模型”。该模型可以生成连贯的文本段落,...

基于AIACC加速快速实现Stable Diffusion生成特定...

本文介绍如何使用GPU云服务器搭建Stable Diffusion模型,并基于ControlNet框架,快速生成特定物体图片。背景信息 Stable Diffusion(简称SD)是一种AI模型,它经过训练可以逐步对随机高斯噪声进行去噪以生成所需要的图像。DreamBooth 是一...

使用GPU拓扑感知调度(Pytorch版)

前提条件 已创建ACK Pro集群,且集群的实例规格类型选择为 GPU云服务器。更多信息,请参见 创建Kubernetes托管版集群。已安装 Arena 已安装GPU拓扑感知调度组件。系统组件版本满足以下要求。组件 版本要求 Kubernetes 1.18.8及以上版本 ...

部署GPU云服务器

GPU实例作为云服务器ECS的一类异构实例...部署完成后,单击GPU云服务器实例名称跳转到ECS控制台,通过Workbench远程连接GPU实例。可以看到AIACC-Training、AIACC-Inference已经安装完成。执行以下命令,确认NVIDIA 驱动已安装完成。nvidia-smi

GPU监控

监控通过安装在阿里云主机(ECS实例)上的监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

应用场景

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。说明 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现计算带来的技术...

神行工具包(DeepGPU)计费

使用神行工具包(DeepGPU)本身不需要额外支付费用,您只需要为执行计算...与神行工具包关联的阿里资源主要包括云服务器ECS、对象存储OSS以及文件存储NAS,关联资源的具体计费标准如下:云服务器ECS计费 对象存储OSS计费 文件存储NAS计费

什么是云服务器ECS

云服务器ECS(Elastic Compute Service)是阿里提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效...

上云须知

GPU云服务器 是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。网络规划 容器集群基础设施(云服务器 ECS)的网络类型选择:专有网络VPC或经典网络。专有网络VPC:推荐使用。采用二层隔离,相对...

客户案例

网关部署及应用最佳实践》《云速搭部署&GPU&云服务器上会展有限公司立足于打造线上会展数字基础设施,充分发挥阿里巴巴集团在人工智能、数据技术、计算等方面的积累,集成阿里巴巴商业操作系统的全域数字化运营能力。在上会展数字...

如何选用云服务器

在阿里电子政务上,云服务器有很多不同的规格型号,例如都是4核8G内存的云服务器,在不同应用场景下的性能跑分不同,价格也不同。本文为您介绍阿里云服务的常见参数类别,帮助您根据不同的业务需求选择合适的云服务。云服务器参数...

功能发布记录

最新一代GPU云主机gn6v(V100机型)正式售卖。2018-09-12 全部 实例规格族 2018年3月 功能名称 功能描述 发布时间 发布地域 相关文档 GPU实例 支持NGC GPU加速容器。2018-03-28 全部 在gn5实例上部署NGC环境 2017年2月 功能名称 功能描述 ...

新功能发布记录

阿里客户端是由阿里官方推出的客户端工具,提供了对云服务器ECS、弹性容器实例ECI、轻量应用服务器、阿里托管实例的资源浏览、查找、远程连接等功能。2022-07-08 全部 阿里客户端概述 2022年06月 功能名称 功能概述 发布时间 发布...

常用操作导航

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的操作方式。在使用云服务器ECS时,您可能会遇到各种问题,例如远程连接、更换操作系统、扩容盘、升高或降低实例配置、使用快照或镜像等。本文介绍了云服务器ECS的常用操作,...

应用场景

推荐搭配使用:云服务器 ECS/GPU 服务器 EGS/高性能计算服务(Alibaba Cloud HPC)+容器服务+对象存储 OSS/文件存储 NAS/CPFS 相关文档:PyTorch分布式训练 TensorFlow分布式训练 微服务架构 实现敏捷开发和部署落地,加速企业业务迭代...

DescribeScalingConfigurations

String LocalHost 云服务器主机名。SystemDiskName String cloud_ssd_Test 系统盘的名称。InternetMaxBandwidthOut Integer 0 公网出带宽最大值,单位为Mbps(Mega bit per second)。可能值: 按带宽计费:0~1024,如果您没有指定该参数...

添加已有节点

手动添加节点方式要求您获取安装命令,登录到对应ECS云服务器上进行安装,每次只能添加一个ECS云服务器。说明 如果您的集群没有节点池,请先创建节点池,然后再添加已有节点。关于创建节点池的具体操作,请参见 操作步骤。登录 容器服务...

DescribeScalingConfigurations-查询ECS类型伸缩配置...

HostName string 云服务器主机名。LocalHost SystemDiskName string 系统盘的名称。cloud_ssd_Test InternetMaxBandwidthOut integer 公网出带宽最大值,单位为Mbps(Mega bit per second)。取值范围:按带宽计费:0~1024,如果您没有...

连接方式概述

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的连接方式。ECS支持通过多种方式连接实例,包括阿里提供的连接工具(例如Workbench、VNC等)和第三方客户端工具。您可以综合考虑目标实例的操作系统、本地设备的操作系统、...

CreateScalingConfiguration-创建一个ECS类型伸缩配置

云服务器主机名。半角句号(.)或短划线(-)不能作为首尾字符,不能连续使用半角句号(.)或短划线(-)。另外,不同类型实例的命名要求如下: Windows实例:主机名长度为2~15,可以包含大小写字母、数字和短划线(-)。不能包含半角...

GPU实例(计算型和虚拟化型)中安装GRID驱动...

市场镜像中配备了已预装GRID驱动的免费镜像,创建Windows操作系统的GPU虚拟化型实例时,您可以在镜像区域通过 直接选用该免费镜像 来自动安装GRID驱动(Windows)。本文主要介绍如何在GPU实例(计算型和虚拟化型)中安装GRID驱动...

启动实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何在ECS管理控制台上启动实例。前提条件 实例满足以下条件之一: 实例处于 已停止 状态。按量付费实例处于 已过期 状态,您已经结清欠费账单但自动重开机...

创建弹性裸金属服务器实例

创建弹性裸金属服务器实例和创建普通云服务器实例的步骤类似,本文仅介绍弹性裸金属特有的基本配置项,如果您想了解其他通用配置,请参见 自定义购买实例。操作步骤 登录 ECS管理控制台。在左侧导航栏,选择 实例与镜像>实例。单击 创建...

什么是无影电脑(专业版)

无影电脑(专业版)与 云服务器 ECS 的异同 比较项 无影电脑(专业版)云服务器 概念 无影电脑(专业版) 是一种基于计算的上桌面服务,采用桌面即服务DaaS(Desktop as a Service)为您提供易用、安全、高效的上桌面办公系统。...

CreateScalingConfiguration

云服务器主机名。半角句号(.)或短划线(-)不能作为首尾字符,不能连续使用半角句号(.)或短划线(-)。另外,不同类型实例的命名要求如下: Windows实例:主机名长度为2~15,可以包含大小写字母、数字和短划线(-)。不能包含半角...

使用限制

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的使用限制。本文介绍云服务器ECS在产品功能和服务性能上的不同限制,以及如何申请更高配额。限制概述 使用云服务器ECS有下列限制:仅弹性裸金属服务器和超级计算集群支持二次...

在ACK集群上使用eRDMA

在 选择已有云服务器实例 配置项页面,选择手动添加已有云服务器实例。具体操作,请参见 手动添加节点。在每个节点上安装最新版本的eRDMA驱动。ECS实例(企业级x86规格)上配置eRDMA的方法,请参见 在企业级x86实例上配置eRDMA。GPU实例上...

在Windows容器中使用基于DirectX的GPU加速

DirectX可以允许GPU从事更多的通用计算工作,同时减轻过载,鼓励开发人员更好地将GPU作为并行处理使用。前提条件 已创建Kubernetes集群,且集群版本不低于v1.20.4。具体操作,请参见 创建Kubernetes托管版集群。Windows节点仅支持部署...

停止实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍停止ECS实例,以及VPC内实例节省停机模式相关操作。前提条件 实例必须处于 运行中 状态。警告 停止实例会中断您的业务,请谨慎执行。停止包年包月实例 说明...

异构服务型

本文介绍云服务器ECS异构服务型实例规格族的特点,并列出了具体的实例规格。异构服务型实例规格族video-trans video-trans的特点如下: 提供专属硬件资源和物理隔离 高密度转码,例如显示格式1080P、帧速率30 FPS、编码格式HEVC时,硬件...

什么是弹性加速计算实例EAIS

弹性加速计算实例EAIS(Elastic Accelerated Computing Instances)是一款阿里提供的性能卓越、成本优化、弹性扩展的IaaS(Infrastructure as...EAIS所绑定的云服务器ECS实例需要遵循其自身的 部署建议,同时也可以选择ECS支持的 相关服务。

释放实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。因此,GPU实例仅支持释放按量付费实例(包括抢占式实例)和已到期的包年包月实例。包年包月实例到期前,需申请退款或转为按量付费实例后再释放。本文介绍手动和自动...

ECS实例如何升级GPU驱动

概述 本文主要介绍如何升级ECS实例的GPU驱动。详细信息 阿里提醒您: 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与...适用于 云服务器ECS

创建F3实例

阅读并确认《云服务器ECS服务条款》和《云服务器ECS退订说明》 然后单击 确认下单。说明 仅购买包年包月实例时,才需要阅读并确认《云服务器ECS退订说明》。创建实例一般需要3~5分钟,请您耐心等待。您可前往控制台的实例列表页面查看实例...

创建F3实例

阅读并确认《云服务器ECS服务条款》和《云服务器ECS退订说明》 然后单击 确认下单。说明 仅购买包年包月实例时,才需要阅读并确认《云服务器ECS退订说明》。创建实例一般需要3~5分钟,请您耐心等待。您可前往控制台的实例列表页面查看实例...

扩缩容节点池

关于ebmgn7e,请参见 GPU计算型弹性裸金属服务器实例规格族ebmgn7e。将ECS实例添加到集群:ESS弹出ECS实例后,实例将自动运行 cloud-init 脚本(由ACK维护),对节点进行初始化,并将节点加入到节点池。运行的日志将保存到节点/var/log/...

使用限制

限制概述 使用云服务器ECS有下列限制:仅弹性裸金属服务器和超级计算集群支持二次虚拟化,其他规格族不支持安装虚拟化软件和二次虚拟化。不支持声卡应用。不支持直接加载外接硬件设备(如硬件加密狗、U盘、外接硬盘、银行UKey等),您可以...

休眠实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。如果您在某个时间段内无需运行ECS实例,也不会执行某些操作(如升降配等),建议您休眠ECS实例。相比停止实例,休眠实例后再次启动实例,ECS实例会自动恢复至休眠前...

使用限制

本文介绍云服务器ECS在产品功能和服务性能上的不同限制,以及如何申请更高配额。限制概述 使用云服务器ECS有下列限制: 仅弹性裸金属服务器和超级计算集群支持二次虚拟化,其他规格族不支持安装虚拟化软件和二次虚拟化。不支持声卡应用。不...
共有150条 < 1 2 3 4 ... 150 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
专有宿主机 云虚拟主机 GPU 云服务器 DDoS 防护 云安全中心 弹性公网 IP
新人特惠 爆款特惠 最新活动 免费试用