阿里云文档 2025-03-18

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-18

如何本地部署DeepSeek

DeepSeek-V3/R1是拥有600B以上参数量的专家混合(MoE)模型,并已经开源了模型权重。本文为您介绍在GPU实例上部署DeepSeek-R1蒸馏模型推理服务。

阿里云文档 2025-03-17

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-17

本地部署通义千问QwQ-32B模型

通义千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为通义千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建通义千问QwQ-32B的推理服务。

阿里云文档 2025-02-26

本地单机部署满血版Deepseek模型

DeepSeek-V3/R1是拥有600B以上参数量的专家混合(MoE)模型,并已经开源了模型权重。在ebmgn8v实例上快速方便地构建DeepSeek-V3/R1的推理服务,您无需深入了解底层硬件,也无需额外配置即可开箱即用。本文为您介绍如何在ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。

问答 2024-08-28 来自:开发者社区

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu?

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu?设置device='cuda:1'模型在cuda 0之外的gpu上面做推理就会出现 RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:1 and cuda:0

问答 2024-08-13 来自:开发者社区

ModelScope没有看见复制,模型选择、cpu/GPU选择有特别要求吗,有详细说明吗?

ModelScope没有看见复制,模型选择、cpu/GPU选择有特别要求吗,有详细说明吗?

问答 2024-08-06 来自:开发者社区

modelscope模型文件都下载成功了,部署报错,是不是说只能在GPU下运行,CPU不行吗?

"请问modelscope模型文件都下载成功了,部署报错,是不是说只能在GPU下运行,CPU不行吗? "

问答 2024-06-12 来自:开发者社区

modelscope-funasr从磁盘加载模型,且使用gpu,但gpu没有被启动,怎么回事?

modelscope-funasr从磁盘加载模型,且使用gpu,照着下图例子,但gpu没有被启动,怎么回事?

问答 2024-05-25 来自:开发者社区

请问qwen-72b-chat ModelScope模型本地部署推理需要多少GPU显存?

请问qwen-72b-chat ModelScope模型本地部署推理需要多少GPU显存?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

+关注