GPU云服务器

GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景,型号有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100
阿里云成为中国首家与NGC GPU加速容器合作的云厂商。

GA1(S7150)购买 GN4(M40)购买 GN5(P100)购买 GN5i(P4)购买 GN6(V100)申请公测

  • AI深度学习

    深度学习训练和推理在线服务,图像识别
    图像内容鉴别,语音识别。

  • 视频处理

    大规模高清视频转码,4K/8K高清直播
    多人视频会议,片源修复。

  • 科学计算

    影视渲染制作,碰撞模拟
    计算金融,基因工程,气象预测。

  • 图形可视化

    工程设计,非线性编辑
    远程教育应用,3D展示。

产品特性

  • 计算能力

    GPU天生的超强计算能力

    GA1实例计算性能力

    GA1实例最多可提供 4 颗AMD S7150 GPU、56 个 vCPU 和 160GB 主机内存,以及共计 32GB 的 GPU显存、总计提供8192个并行处理核心、最高15 TFLOPS的单精度浮点运算处理能力和最高1 TFLOPS的双精度峰值浮点处理性能。


    GN4实例计算性能力

    GN4实例最多可提供 2 个 NVIDIA M40 GPU、56 个 vCPU 和 96GB 主机内存,以及共计 24GB 的 GPU显存、总计提供6000个并行处理核心、最高14 TFLOPS的单精度浮点运算处理能力。


    GN5实例计算能力

    GN5实例基于NVIDIA的Tesla P100 GPU,最多提供 8个NVIDIA P100 GPU,52个vCPU和480GB主机内存,以及共计128GB的GPU显存。以最高74.4 TFLOPS的单精浮点计算能力满足了深度学习等通用GPU计算场景下,对大规模并行浮点运算的算力需求。同时提供最高37.6TFLOPS的双精浮点计算能力,满足科学计算等高性能计算场景的需求。


    GN5i实例计算能力

    GN5i实例基于NVIDIA的Tesla P4 GPU,最多提供2个NVIDIA P4 GPU,56个vCPU和224GB主机内存,以及共计16GB的GPU显存,最高11 TFLOPS的单精浮点计算能力和44 TOPS的int8定点运算处理能力。


    GN6实例计算能力

    GN6实例基于NVIDIA的Tesla V100 GPU,最多提供 8个NVIDIA V100 GPU,88个vCPU和256GB主机内存,以及共计128GB的GPU显存。使用Tensor Core加速可以提供最高1000 TFLOPS的深度学习运算能力,并以最高125.6 TFLOPS的单精浮点计算能力满足通用GPU计算场景下,对大规模并行浮点运算的算力需求。同时提供最高62.4 TFLOPS的双精浮点计算能力,满足科学计算等高性能计算场景的需求。

  • 网络性能出色

    突出的网络性能将计算跟渲染发挥极致

    满足计算通路网络性能需求

    GPU云服务器实例最大支持2000000的PPS及25Gbps的内网带宽,可以满足计算通路上网络的性能需求


    存储性能强大

    有些实例搭配了本地高速缓存盘,配合高效云盘或SSD云盘,在保证数据高可用的前提下,将计算跟渲染性能发挥到极致。

  • 购买方式灵活

    支持灵活的付费方式,用户按需求购买

    按年支付

    实例支持灵活的使用支付方式,用户可以按年支付以获得最高的使用折扣;


    按月支付

    支持按月周期付费,以降低用户的计算资源使用一次性投入成本,并且具有相对不错的单位小时使用价格


    按小时支付

    同样支持按小时的付费方式使用户以最低的单次使用成本来应对临时性的短期使用需求。


    竞价型支付

    按需竞价,低至一折起。

  • 高性能实例存储( GA1和GN5特有)

    搭载超高性能实例存储

    搭载超高性能实例存储

    GA1规格族在支持挂载云端3副本存储的高可靠性云盘存储的同时,随实例搭配了最大1.4TB的超高性能实例存储,可提供230000的读/写IOPS性能、最大1900MBps的读带宽、1100MBps写带宽,读写延迟可稳定在200us左右(测试场景为24W随机读,iodepth=12)。

选对规格类型

  • 视频处理/H.264
  • 视频处理/H.264&H.265
  • 3D图形渲染
  • 深度学习/训练
  • 深度学习/在线推理
  • 科学计算
  • GA1(AMD S7150)
  • GN4(Nvidia M40)
  • GN5(Nvidia P100)
  • GN5i(Nvidia P4)
  • GN6(Nvidia V100)

温馨提示:3D图形渲染GN5(Nvidia P100),GN5i(Nvidia P4),GN6(Nvidia V100)非完全支持,有时间期限,需额外购买lisence。

GPU云服务器核心优势对比

  • GPU卡
  • 计算力
  • 显存
  • CPU/内存比
  • 网络能力
  • 本地数据缓存盘
  • 核心内容
  • GPU卡


  • INT8整型(TOPS)
    FP32单精度浮点(TFLOPS)
    FP64双精度浮点(TFLOPS)

  • GPU显存(GB)

  • CPU/内存比

  • 带宽

  • 本地数据缓存盘
  • GN6(Tesla V100)
  • 最大支持 8 * Nvidia V100

  • 125.6

    62.4

  • 8*16

  • 1:4

  • 25Gbps

    400万pps

  • GN4(Tesla M40)
  • 最大支持 2 * Nvidia M40

  • 14

    0.4

  • 2*12

  • 1:1.5~1:7.5

  • 10Gbps

    120万pps

  • GN5(Tesla P100)
  • 最大支持 8 * Nvidia P100

  • 74.4

    37.6

  • 8*16

  • 1:4~1:8.9

  • 25Gbps

    400万pps

  • GN5i(Tesla P4)
  • 最大支持 2 * Nvidia P4

  • 11

    0.34

  • 2*8

  • 1:4

  • 10Gbps

    200万pps

触达全球节点部署

触达全球节点部署

  • 美国西部1 (硅谷)

  • 美国西部2 (弗吉尼亚)

  • 欧洲中部1 (法兰克福)

  • 亚太东南1 (新加坡)

  • 亚太东南2 (悉尼)

  • 华北 (3)

  • 华东 (2)

  • 华南

  • 香港

常见实战场景

  • 云端在线渲染(GA1)

  • 通用加速能力(GN4)

  • 超强计算加速能力(GN5)

  • AI推理计算(GN5i)

  • 云端在线渲染(GA1)

    云端在线渲染

    通过云桌面,快速介入GA1,获得更好的视觉和操控体验。也可以通过远程桌面连接协议可以实现在线实时的渲染和图形图像编辑,可在任何地点使用多种设备接入。数据存储在NAS或者OSS上,随时内网访问拉取使用,保护数据安全。固定办公场所可通过高速通道和NAT网关进一步的提升网络体验和降低成本。GA1实例目前只支持 windows server 2008r2 系列(64位), windows 7 系列(64位),CentOS7.3 (64位), Ubuntu16.04 (64位)等系统,其他不支持,请关注windows server 2016 和 windows 10 近期上线。

    能够解决

    • 可视化实例

      任何地方在线编辑,计算性能强大

    • 解决方案整合

      高速通道、NAT网关、OSS、NAS多种产品可组合方案。

  • 通用加速能力(GN4)

    优异的通用GPU计算加速能力

    GN4实例基于NVIDIA的Maxwell M40 GPU,以最高14TFLOPS的单精浮点计算能力满足了深度学习等通用GPU计算场景下,对大规模并行浮点运算的算力需求。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。

    能够解决

    • 弹性伸缩

      与ECS的ESS和SLB结合实现弹性扩容

    • 快速部署

      利用容器实现快速部署,运维和调度。

  • 超强计算加速能力(GN5)

    超强的浮点运算加速能力

    GN5实例基于NVIDIA的Tesla P100 GPU,以最高74.4 TFLOPS的单精浮点计算能力满足了深度学习等通用GPU计算场景下,对大规模并行浮点运算的算力需求。同时提供最高37.6TFLOPS的双精浮点计算能力,满足科学计算等高性能计算场景的需求。支持GPU Direct P2P技术,可通过PCI总线实现GPU之间直接通信,大大降低GPU间的通信延迟。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化用户部署。

    能够解决

    • 弹性伸缩

      与ECS的ESS和SLB结合实现弹性扩容

    • 快速部署

      利用容器实现快速部署,运维和调度。

  • AI推理计算(GN5i)

    优异的AI推理能力

    GN5i实例基于NVIDIA的Tesla P4 GPU,以最高11 TFLOPS的单精浮点计算能力和44 TOPS的int8定点运算处理能力满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75W,具有极高的性能功耗比。与弹性计算生态的完美结合,为不论是在线还是离线场景提供了通用的解决方案。搭配容器服务使用,简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化用户部署。

    能够解决

    • 弹性伸缩

      与ECS的ESS和SLB结合实现弹性扩容

    • 快速部署

      利用容器实现快速部署,运维和调度。