阿里云文档 2026-01-14

调用ListModelCategory接口查询模型类别-人工智能平台 PAI-阿里云

查询模型类别列表。

文章 2025-06-20 来自:开发者社区

【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型

MiniMax-M1 模型是由 MiniMax 公司6月17日全新推出的大语言模型,使用 hybrid Mixture-of-Experts (MoE) 架构,并使用了 lightning attention 机制。 MiniMax 公司称其为世界上第一个开源的大规模混合架构的推理模型。 MiniMax-M1  模型原生支持 1 百万个 token 的上下文长度, 并...

【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
文章 2025-06-13 来自:开发者社区

DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践

随着大语言模型(LLM)规模和计算需求增长,如何高效应用这些模型成为关键挑战。阿里云 PAI 团队推出 EasyDistill 开源框架,简化大模型的知识蒸馏过程,显著降低计算成本,同时保持高性能。 基于 EasyDistill 训练的 DistilQwen-ThoughtX 系列模型,结合创新的变长思维链推理技术,能够根据任务难度自适应调整推理步骤,避免传统思维链方法的“过度...

DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践
文章 2025-05-07 来自:开发者社区

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

在大语言模型领域的快速发展中,如何有效平衡高效推理和模型思维能力之间的矛盾一直是学术界和工业界关注的重点。DeepSeekV3-0324 默认没有采用深度思考的模式,使得模型推理速度更快,兼顾了快速推理和复杂任务处理之间的平衡。 DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2...

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
文章 2025-04-29 来自:开发者社区

Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署

一、模型简介 Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。基于广泛的训练,Qwen3 在推理、指令跟随、Agent 能力和多语言支持方面取得了突破性的进展,具有以下关键特性: 独特支持在思考模式(用于复杂逻辑推理、数学和编码)和 非思考模式(用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能。 ...

Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署
文章 2025-04-08 来自:开发者社区

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

随着 DeepSeek-R1 和 QwQ-32B 等面向深度推理的大语言模型的开源,“大模型+慢思考”已成为拓展大语言模型智能边界的标准配置。然而,这些模型在资源受限的移动设备和边缘计算场景中的普及仍面临巨大挑战。因此,学术界和工业界迫切需要解决如何有效利用知识蒸馏技术,将这些超大规模深度推理模型的知识迁移到小模型中,从而提升计算效率并降低部署成本的问题。为此,阿里云人工智能平台 PAI 在 D....

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注