安装和使用AIACC-AGSpeed

AIACC-AGSpeed(简称AGSpeed)专注于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,可以实现无感的计算优化性能。本文为您介绍安装和使用AGSpeed的方法。前提条件 已创建阿里云GPU实例,且...

基于AIACC加速快速实现LLaMA-7B指令微调

AIACC-AGSpeed(简称AGSpeed)是阿里推出的一个基于PyTorch深度学习框架研发的计算优化编译,用于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,可以实现计算优化。什么是计算优化编译AIACC-AGSpeed 重要 阿里不对...

修复NVIDIA GPU驱动漏洞CVE-2021-1056公告

Kubernetes集群中如果存在阿里云GPU(EGS)的节点,都有可能存在该漏洞。本文介绍该漏洞的背景信息、影响范围和解决方案。背景信息 漏洞CVE-2021-1056是NVIDIA GPU驱动程序与设备隔离相关的安全漏洞。当容器以非特权模式启动,攻击者利用这...

基于AIACC加速快速实现AIGC绘画

本文基于阿里云GPU服务器和Stable Diffusion的WebUI框架,指导您如何基于AIACC加速快速实现AIGC绘画。重要 阿里不对第三方模型的合法性、安全性、准确性进行任何保证,阿里不对由此引发的任何损害承担责任。您应自觉遵守第三方模型的...

安装AIACC-Training

前提条件 已创建阿里云GPU实例,且GPU实例需满足以下要求:操作系统为Alibaba Cloud Linux、CentOS 7.x或Ubuntu 16.04以上版本。已安装NVIDIA Driver和CUDA 10.0或以上版本。背景信息 本文以安装AIACC-Training 1.5.0版本为例,您可以根据...

异构计算产品最佳实践概览

GPU云服务器 搭建Linux环境License Server 使用GRID驱动必须申请相应的License,同时需要将License部署在License Server上,本教程以Ubuntu 18.04操作系统为例,介绍如何搭建Linux操作系统的License Server。搭建Windows环境的License ...

手动安装AIACC-Inference(AIACC推理加速)Torch版

前提条件 已创建阿里云GPU实例:实例规格:配备NVIDIA A100、A10、V100或T4 GPU。说明 更多信息,请参见 实例规格族。实例镜像:Ubuntu 16.04 LTS或CentOS 7.x。背景信息 AIACC-Inference(AIACC推理加速)Torch版通过对模型的计算图进行...

阿里异构计算产品总览

GPU云服务器是基于GPU应用的计算服务器GPU在执行复杂的数学和几何计算方面有着独特的优势。特别是浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。作为阿里弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,...

RAPIDS加速机器学习最佳实践

本方案适用于使用RAPIDS加速库和GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU和RAPIDS在某些场景下可以取得非常明显的加速效果。解决的问题 搭建RAPIDS加速机器学习环境。使用容器服务Kubernetes版部署R...

RAPIDS加速图像搜索最佳实践

本方案适用于使用RAPIDS加速平台和GPU云服务器来对图像搜索任务进行加速的场景。相比CPU,利用GPU+RAPIDS在图像搜索场景下可以取得非常明显的加速效果。解决的问题 搭建RAPIDS加速图像搜索环境。使用容器服务Kubernetes版部署图像搜索环境...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

使用AIACC-Training(AIACC训练加速)加速BERT ...

本方案适用于自然语言训练场景,使用GPU云服务器和极速型NAS进行BERT Finetune模型训练,使用AIACC-Training(AIACC训练加速)可以有效提升多机多卡的训练效率。实现的方式 使用GPU云服务器搭建训练环境。使用极速型NAS存储共享训练数据。...

使用ACK服务实现GPU成本优化

GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。更多关于GPU服务器的介绍,请参见 GPU服务器产品详情页。容器服务 ACK 容器服务Kubernetes版(ACK)提供高性能可伸缩的容器应用管理...

应用场景

GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景,神行工具包为了配合GPU云服务器的计算服务增强能力,也适用于所有AI训练场景和AI推理场景。本文主要介绍GPU云服务器和神行工具包的具体应用场景。GPU云服务器...

GPU AI模型训练最佳实践

本方案适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。实现的方式 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练服务加速训练。使用Arena一键提交...

组件概述

在阿里上使用虚拟化GPU云服务器时,directx-device-plugin-windows可以为Windows容器提供基于DirectX构建的GPU加速功能。ack-cluster-agent 系统组件 注册集群中部署在用户集群中的组件,负责与注册集群管控侧组件建立通信信道。ack-...

ASP协议

对于无快速持续变化的场景(例如文档基本操作、网页浏览)和有快速持续变化的场景(例如视频播放、游戏),ASP协议构建的流化引擎可以智能地根据场景选择流化路径,支持普通云电脑和GPU云电脑。先进的压缩算法 云电脑内的屏幕内容往往是...

应用场景

无影电脑 可广泛应用于具有高数据安全管控、高性能计算等要求的金融、设计、视频、教育等领域,适用于多种办公场景,如远程办公、多分支机构、安全OA、短期使用、专业制图等。远程办公场景 可以随时随地,通过客户端连接电脑进行办公,...

上云须知

GPU云服务器 是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。网络规划 容器集群基础设施(云服务器 ECS)的网络类型选择:专有网络VPC或经典网络。专有网络VPC:推荐使用。采用二层隔离,相对...

产品优势

对于无快速持续变化的场景(例如文档基本操作、网页浏览)和有快速持续变化的场景(例如视频播放、游戏),ASP协议构建的流化引擎可以智能地根据场景选择流化路径,支持普通云电脑和GPU云电脑。先进的压缩算法 云电脑内的屏幕内容往往是...

SIP对接指引

IP:联系「阿里呼叫中心-售后支持」(13148375146)钉钉服务号索要SIP服务器IP信息 端口:1)公网入端口:8000 2) 公网出端口:8000 客户需要保证通过公网访问上述协议、地址和端口。注意:网关信令需要原路转发回sbc,即发回sip信令来源...

查看电脑信息

本文为您介绍如何查看电脑的基础信息、配置信息以及计费信息。操作入口 不同客户端的不同版本界面存在差异,请以实际展示信息为准。下文以 Windows客户端 V6.4.0版本为例,为您介绍如何查看电脑的基础信息、配置信息以及计费信息:在待...

什么是集群极速部署工具FastGPU

FastGPU作为衔接您的线下人工智能算法和线上阿里海量GPU计算资源的关键一环,方便您将人工智能计算任务构建在阿里的IaaS资源上。使用FastGPU构建人工智能计算任务时,您无需关心IaaS层的计算、存储、网络等资源部署操作,即可达到简单...

异构计算集群概述

阿里容器服务ACK支持对各种异构计算资源进行统一调度和维管理,能够显著提高GPU、NPU等异构计算集群资源的使用效率。本文介绍阿里容器服务ACK支持的异构计算集群。背景信息 随着5G、人工智能、HPC(High Performance Computing)、...

GPU云服务器计费

GPU云服务器计费相关功能与云服务器ECS一致,本文为您介绍GPU云服务器涉及的计费信息。计费项及其计费方式 一台GPU实例包括计算资源(vCPU、内存和GPU)、镜像、块存储等资源,其中涉及计费的GPU资源如下表所示。计费项 计费说明 计费方式 ...

安装共享GPU调度组件

ACK Pro集群的实例规格架构设置为 GPU云服务器 其他配置,请参见 创建ACK集群Pro版。已获取集群KubeConfig并通过kubectl工具连接集群。使用限制 请勿将共享GPU调度的节点的CPU Policy设置为 static。目前GPU隔离模块cGPU 1.5.0以下版本不...

使用VNC登录实例

无法使用Workbench和远程连接软件(例如PuTTY、Xshell、SecureCRT等)连接实例时,您可以通过VNC远程连接方式登录实例,查看云服务器ECS操作界面的实时状态。重要 自2023年7月10日起,远程连接工具VNC无需单独设置VNC登录密码,即可安全...

Serverless GPU概述

GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细功能和优势。...

Serverless GPU概述

GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细功能和优势。...

导入镜像

如果无影电脑提供的镜像无法满足业务要求,您可以制作自定义镜像并将其导入无影电脑控制台,然后在创建电脑时使用该自定义镜像。本文介绍如何制作自定义镜像并将自定义镜像导入无影电脑。前提条件 如果您是RAM用户,需先联系阿里...

GPU监控

请确保您已在云服务器ECS上安装监控插件。具体操作,请参见 安装和卸载C++版本插件。请确保您已添加监控图表,且包含GPU的监控项。具体操作,请参见 添加监控图表。GPU监控项说明 您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU...

创建配备GPU驱动的GPU实例(Linux)

实例通过添加系统盘、数据盘和共享盘NAS获得存储能力,云服务器ECS提供了盘和本地盘满足不同场景的需求。盘可以用作系统盘和数据盘,包括ESSD盘、SSD盘、高效盘等类型。更多信息,请参见 盘概述。说明 随实例一起创建的盘和...

共享GPU调度概述

本文为您介绍阿里共享GPU方案、共享GPU专业版的优势、共享GPU的基础版与专业版的功能对比及使用场景,帮助您了解和更好地使用共享GPU的能力。视频介绍 背景介绍 阿里 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes) ...

桌面迁移

服务器迁移中心SMC支持将您的源服务器迁移至阿里无影桌面。本文介绍如何将源服务器迁移至阿里无影桌面。背景信息 无影桌面(Elastic Desktop Service)是一种易用、安全、高效的上桌面服务。它支持快速便捷的桌面环境创建、部署...

命令行使用说明

GPUGPU规格和数量。instance_type:实例规格。参数说明: a:列出您当前阿里账户下所有实例。会提供Key-Owner(密钥对)和instance_id(实例id)两个额外的信息。查询当前Linux账户下的实例: fastgpu ls 查询同一个阿里账号不同...

使用产品前的准备工作

ACK 容器服务 ECS 云服务器 任务中包含需要使用GPU的GPU 云服务器 数据检索 标签检索 ElasticSearch 检索分析服务 以图搜图/语义检索 Lindorm 原生多模数据库 自定义子 将自研的算法镜像上传到平台,参与计算任务 ACR 代码仓库 1)...

使用限制

本文介绍 无影电脑 功能相关的一些限制,以便您更好地使用 无影电脑。地域 无影电脑 支持的地域如下表所示。地域名称 地域ID 中国地区(包含中国香港、中国澳门,不包含中国台湾)华东1(杭州)cn-hangzhou 华东2(上海)...

准实时推理场景

与函数计算同等GPU规格的GPU云服务器单价约为 14元/小时。更多计费详情,请参见 产品计费。示例一 假设您的GPU函数一天调用量为3600次,每次为1秒钟,使用4 GB显存规格的GPU实例(模型大小为3 GB左右)。您的日均资源利用率(仅时间维度,...

内置时空数据引擎Ganos

Ganos支持各类空间栅格型数据的导入导出、拼接、剪切、统计分析等操作,可建模对象包括全色/多光谱/高光谱各类遥感影像、数字高程模型、三维体素模型等,并融合了GPU的并行计算加速能力和OSS稳定、高效、低成本的对象存储扩展能力。...

GPU监控

请确保您已在云服务器ECS上安装监控插件。具体操作,请参见 安装和卸载C++版本插件。请确保您已添加监控图表,且包含GPU的监控项。具体操作,请参见 添加监控图表。GPU监控项说明 您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU 云服务器 加密服务 弹性公网 IP 阿里云物联网平台 机器学习平台 PAI 短信服务
新人特惠 爆款特惠 最新活动 免费试用