文章 2025-04-30 来自:开发者社区

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

01.前言 Qwen于近日发布了Qwen3系列模型,包含了各个不同规格的Dense模型和MoE模型。开源版本中,Dense模型基本沿用了之前的模型结构,差别之处在于对于Q和K两个tensor增加了RMSNorm;MoE模型去掉了公共Expert,其他结构基本与前一致。在模型大小上,涵盖了从0.6B到32B(Dense)和235B(MoE)不同的尺寸。在推理能力上,增加了对于thinkin...

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测
文章 2025-01-06 来自:开发者社区

如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台

请教下各位大佬。我在 together AI上基于Qwen2-7B训练了一个模型。 我现在想要将这个模型部署到https://www.modelscope.cn/ 中。应该怎么做? lora方式进行微调的模型 模型是Qwen2-7B未对齐的模型

问答 2024-07-30 来自:开发者社区

使用lora微调qwen-vl模型之后,输出的ModelScope全是乱码,这是什么情况?

使用lora微调qwen-vl模型之后,输出的ModelScope全是乱码,这是什么情况?

问答 2024-07-24 来自:开发者社区

ModelScope的dsw上部署通义千问-7B调用快速开始代码的时候发生了以下错误,请问怎么解决?

"在阿里云的ModelScope的dsw上部署通义千问-7B,调用快速开始代码的时候发生了以下错误,请问怎么解决? "

问答 2024-07-23 来自:开发者社区

对比发现Qwen2-72B-int2效果优于Qwen2-72B,ModelScope有什么优化思路?

目前使用V100部署了Qwen2-72B(6卡)和Qwen2-72B-int2(单卡)模型,对比发现Qwen2-72B-int2效果优于Qwen2-72B,ModelScope是否有什么好的优化思路?

问答 2024-07-23 来自:开发者社区

ModelScope上通义千问-Audio在阿里云PAI EAS上部署完如何使用API调用呢?

请问下魔搭ModelScope上通义千问-Audio在阿里云PAI EAS上部署完如何使用API调用呢?

问答 2024-07-02 来自:开发者社区

Qwen2的上下文理解能力并不是很强吧,modelscope有啥好的提示词吗?

Qwen2的上下文理解能力并不是很强吧,进行了五轮对话,又问第二轮的内容记不住,modelscope有啥好的提示词吗?

问答 2024-06-26 来自:开发者社区

有人测过qwen2-72B-int4么,ModelScope量化后,精度下降了很多?

有人测过qwen2-72B-int4么,ModelScope量化后,精度下降了很多?

问答 2024-06-26 来自:开发者社区

跑通义千问ModelScope-7B-Chat的例子,会出现图中问题,请问怎么处理?

"跑通义千问ModelScope-7B-Chat的例子,会出现图中问题,请问怎么处理? You are trying to offload the whole model to the disk. Please use the disk_offload function instead"

问答 2024-06-26 来自:开发者社区

目前1.7.1的版本提示没有qwen2模型,向下载最新的modelscope 用哪个源?

想用qwen2,但是目前1.7.1的版本提示没有这个模型,想下载最新的modelscope 用哪个源?用阿里源可以嘛 默认源超时

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

+关注