阿里云文档 2026-03-06

本地部署千问QwQ-32B模型

千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建千问QwQ-32B的推理服务。

阿里云文档 2025-12-19

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是拥有671B参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。

阿里云文档 2025-04-16

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-04-08

本地单机部署满血版DeepSeek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用SGLang作为DeepSeek模型的推理框架,在一台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-18

如何本地部署DeepSeek

DeepSeek-V3/R1是拥有600B以上参数量的专家混合(MoE)模型,并已经开源了模型权重。本文为您介绍在GPU实例上部署DeepSeek-R1蒸馏模型推理服务。

问答 2024-02-01 来自:开发者社区

modelscope-funasr搭配vad模型无法使用gpu,使用示例代码都报错,怎么解决?

speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch modelscope-funasr搭配vad模型无法使用gpu,使用示例代码都报错,怎么解决?已经提issue了,https://github.com/alibaba-damo-academy/FunASR/issues/1307

问答 2023-04-22 来自:开发者社区

有大哥用过ModelScope这个模型吗?它是需要GPU环境才能部署吗?我用CPU环境部署它,报错了

有大哥用过ModelScope这个模型吗?它是需要GPU环境才能部署吗?我用CPU环境部署它,报错了。。。。 RuntimeError: Failed to import modelscope.models.nlp.mglm.mglm_for_text_summarization because of the following error (look up to see its traceba....

问答 2023-03-17 来自:开发者社区

【SPACE-T表格问答预训练模型-中文-通用领域-base】训练时使用gpu报错

将模型configuration.json里面的device设置为"cuda",运行官网提供的训练脚本,报张量不在同一设备的问题。 版本: python 3.8.16 modelscope 1.3.0 torch 1.10.0 torchaudio ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注