阿里云文档 2026-03-06

本地部署千问QwQ-32B模型

千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建千问QwQ-32B的推理服务。

阿里云文档 2025-12-19

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是拥有671B参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。

阿里云文档 2025-04-16

双机分布式部署满血版Deepseek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用vllm作为DeepSeek模型的推理框架,在两台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-04-08

本地单机部署满血版DeepSeek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用SGLang作为DeepSeek模型的推理框架,在一台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-18

如何本地部署DeepSeek

DeepSeek-V3/R1是拥有600B以上参数量的专家混合(MoE)模型,并已经开源了模型权重。本文为您介绍在GPU实例上部署DeepSeek-R1蒸馏模型推理服务。

文章 2025-02-10 来自:开发者社区

exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! 微信公众号|搜一搜:蚝油菜花 大家好,我是蚝油菜花,今天跟大家分享一下 exo 这个开源项目,它能让你利用家中的日常设备构建强大的 AI 集群。 快速阅读 exo 是一个开源项目,旨在让你利用家中的日常设备(如 iPhone...

exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型
问答 2023-09-27 来自:开发者社区

ModelScope中求教一下,我GPU显存不够,怎么强制用CPU运行魔搭LLM模型呀?

ModelScope中求教一下,我GPU显存不够,怎么强制用CPU运行魔搭LLM模型呀

问答 2023-04-22 来自:开发者社区

请问GPU docker环境运行这个模型https://www.modelscope.cn/mode

请问GPU docker环境运行这个模型https://www.modelscope.cn/models/damo/cv_dut-raft_video-stabilization_base/summary,卡在2023-04-18 17:28:01,109 - modelscope - WARNING - task video-stabilization input definition is ....

文章 2023-01-19 来自:开发者社区

pytorch在GPU上运行模型实现并行计算

pytorch在GPU上运行模型十分简单,只需要以下两部:model = model.cuda():将模型的所有参数都转存到GPU上input.cuda():将输入数据放置到GPU上至于如何在多块GPU上进行并行计算,PyTorch也提供了两个函数,可以实现简单、高效的GPU并行计算。nn.parallel.data_parallel(module, inputs, device_ids=Non....

文章 2023-01-13 来自:开发者社区

基于Pytorch使用GPU运行模型方法及可能出现的问题解决方法

基于Pytorch使用GPU运行模型方法及注意事项一、在基于pytorch深度学习进行模型训练和预测的时候,往往数据集比较大,而且模型也可能比较复杂,但如果直接训练调用CPU运行的话,计算运行速度很慢,因此使用GPU进行模型训练和预测是非常有必要的,可以大大提高实验效率。如果还没有配置好运行环境的博友们可以参考下面博主的文章。1、点击打开《基于Windows中学习Deep Learning之搭建....

基于Pytorch使用GPU运行模型方法及可能出现的问题解决方法

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注