阿里云文档 2025-09-10

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。

阿里云文档 2025-04-21

本地部署通义千问QwQ-32B模型

通义千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为通义千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建通义千问QwQ-32B的推理服务。

阿里云文档 2025-04-16

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-04-08

本地单机部署满血版DeepSeek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用SGLang作为DeepSeek模型的推理框架,在一台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-18

如何本地部署DeepSeek

DeepSeek-V3/R1是拥有600B以上参数量的专家混合(MoE)模型,并已经开源了模型权重。本文为您介绍在GPU实例上部署DeepSeek-R1蒸馏模型推理服务。

问答 2024-03-18 来自:开发者社区

modelscope本地部署72B的模型需要用到多少配置的阿里云服务器?

modelscope本地部署72B的模型需要用到多少配置的阿里云服务器?

问答 2024-01-02 来自:开发者社区

ModelScope中qwen模型能在cpu服务器部署么?

ModelScope中qwen模型能在cpu服务器部署么?

问答 2023-12-18 来自:开发者社区

modelscope前部署的CSANMT模型迁移到了另一台服务器上,显卡是一样的翻译速度变慢了好多?

将ModelScope前部署的CSANMT模型迁移到另一台具有相同显卡、代码和环境的服务器后,发现翻译速度变慢,查看日志后发现似乎没有使用GPU。但是在本地环境中,GPU是可用的,nvidia-smi和nvcc等命令也有效。以下是日志信息:"

问答 2023-10-24 来自:开发者社区

ModelScope你们模型量化的服务器是哪种卡?

ModelScope你们模型量化的服务器是哪种卡?

问答 2023-05-14 来自:开发者社区

请问ModelScope,将微调好的模型导出onnx文件,可以部署到阿里云服务器或者函数计算等等?

请问ModelScope,将微调好的模型导出onnx文件,可以部署到阿里云服务器或者函数计算等等产品中吗?然后再在自己的项目中使用api调用模型传参数

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注