阿里云文档 2026-04-13

使用PAI完成DistilQwen2全链路最佳实践-人工智能平台 PAI-阿里云

DistilQwen2是阿里云人工智能平台PAI基于Qwen2大模型开发的精简语言模型。通过采用知识蒸馏技术,DistilQwen2提升了指令遵循能力,同时保持了较小的参数规模。该模型专为资源受限的环境设计,适用于移动设备和边缘计算场景,能够在显著降低计算资源需求和推理时间的同时,提供优异的性能表现。

阿里云文档 2026-04-13

使用PAI完成QwQ-32B的部署微调与评测-人工智能平台 PAI-阿里云

模型简介阿里云于3月6日开源推出的千问QwQ-32B推理模型,基于大规模强化学习实现了数学、代码与通用能力的突破性提升。整体性能比肩DeepSeek-R1,同时显著降低了部署使用成本。在测数学能力的AIME24评测集上和评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSe...

阿里云文档 2026-04-09

快速开始:Qwen2.5-Coder模型的训练、评测、压缩与部署-人工智能平台 PAI-阿里云

Qwen2.5-Coder,亦称CodeQwen,是阿里云推出的、专注于代码相关任务的大语言模型系列。该系列包含六种模型尺寸(0.5B、1.5B、3B、7B、14B和32B),以满足不同开发者的多样化需求。Qwen2.5-Coder 基于海量代码数据进行训练,在保持强大数学和推理能力的同时,在以代码为中心的应用场景中表现卓越。本教程将以 Qwen2.5-Coder-32B-Instruct 模型为...

文章 2025-05-07 来自:开发者社区

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

在大语言模型领域的快速发展中,如何有效平衡高效推理和模型思维能力之间的矛盾一直是学术界和工业界关注的重点。DeepSeekV3-0324 默认没有采用深度思考的模式,使得模型推理速度更快,兼顾了快速推理和复杂任务处理之间的平衡。 DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2...

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
文章 2025-04-08 来自:开发者社区

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

随着 DeepSeek-R1 和 QwQ-32B 等面向深度推理的大语言模型的开源,“大模型+慢思考”已成为拓展大语言模型智能边界的标准配置。然而,这些模型在资源受限的移动设备和边缘计算场景中的普及仍面临巨大挑战。因此,学术界和工业界迫切需要解决如何有效利用知识蒸馏技术,将这些超大规模深度推理模型的知识迁移到小模型中,从而提升计算效率并降低部署成本的问题。为此,阿里云人工智能平台 PAI 在 D....

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
文章 2025-03-12 来自:开发者社区

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

Qwen2.5(通义千问2.5)是阿里云推出的开源大型语言模型系列,具有很强的代码、数学、推理、指令遵循、多语言理解等能力。DistilQwen2.5 是阿里云人工智能平台 PAI 基于Qwen2.5 大模型推出的、通过黑盒化知识蒸馏和白盒化 Logits 蒸馏结合,进行指令遵循效果增强的、参数较小的语言模型。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能,在较小参数规模下,显....

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
文章 2025-02-28 来自:开发者社区

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用,越来越多的开发者开始尝试复现类似的模型,以提升其推理能力。目前已经涌现出不少令人瞩目的成果。然而,这些新模型的推理能力是否真的提高了呢?EvalScope框架是魔搭社区上开源的评估工具(https://github.com/modelscope/evalscope),提供了对R1类模型的推理性能的评测能力。 在本最佳实践中,我们通过72...

R1类模型推理能力评测手把手实战
文章 2025-02-26 来自:开发者社区

MME-CoT:多模态模型推理能力终极评测!六大领域细粒度评估,港中大等机构联合推出

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 「你的多模态模型真的会思考吗?揭秘链式推理评测新标杆」 大家好,我是蚝油菜花。当所有AI厂商都在吹嘘模型参数时...

MME-CoT:多模态模型推理能力终极评测!六大领域细粒度评估,港中大等机构联合推出
文章 2025-02-17 来自:开发者社区

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用,越来越多的开发者开始尝试复现类似的模型,以提升其推理能力。目前已经涌现出不少令人瞩目的成果。然而,这些新模型的推理能力是否真的提高了呢?EvalScope框架是魔搭社区上开源的评估工具(https://github.com/modelscope/evalscope),提供了对R1类模型的推理性能的评测能力。 在本最佳实践中,我们通过728道推理题...

R1类模型推理能力评测手把手实战
文章 2025-02-14 来自:开发者社区

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用,越来越多的开发者开始尝试复现类似的模型,以提升其推理能力。目前已经涌现出不少令人瞩目的成果。然而,这些新模型的推理能力是否真的提高了呢?EvalScope框架是魔搭社区上开源的评估工具(https://github.com/modelscope/evalscope),提供了对R1类模型的推理性能的评测能力。 在本最佳实践中,我们通过728道推理题...

R1类模型推理能力评测手把手实战

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注