人工智能平台 PAI训练的相关内容

文章 2025-03-12 来自：开发者社区

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

Qwen2.5（通义千问2.5）是阿里云推出的开源大型语言模型系列，具有很强的代码、数学、推理、指令遵循、多语言理解等能力。DistilQwen2.5 是阿里云人工智能平台 PAI 基于Qwen2.5 大模型推出的、通过黑盒化知识蒸馏和白盒化 Logits 蒸馏结合，进行指令遵循效果增强的、参数较小的语言模型。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下，显....

文章 2025-02-28 来自：开发者社区

阿里云PAI发布DeepRec Extension，打造稳定高效的分布式训练，并宣布开源！

近日，阿里云人工智能平台PAI正式发布自研的 DeepRec Extension（即 DeepRec 扩展），旨在以更低成本，更高效率进行稀疏模型的分布式训练。DeepRec Extension 在 DeepRec 训练推理框架之上，围绕大规模稀疏模型分布式训练，创新性地从训练任务的视角提出了自动弹性训练和分布式容错功能，进一步提升稀疏模型训练的整体效率，助力 DeepRec 引擎在稀疏场景中发....

文章 2025-01-17 来自：开发者社区

如何看PAI产品下训练（train）模型任务的费用细节

在控制台-费用-账单详情中，如下点击：其中learn 就是PAI产品的code：点击后等待生成文件，并且下载即可。

文章 2025-01-01 来自：开发者社区

Diff-Instruct：指导任意生成模型训练的通用框架，无需额外训练数据即可提升生成质量

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花原文链接：https://mp.weixin.qq.com/s/faeBUXbDsc-ZhIxmdTWOcw 快速阅读功能：Diff-Instruct 能从预训练扩散模型中提取知识，指导...

问答 2024-12-14 来自：开发者社区

EasyRec在PAI平台训练怎么查模型评估效果？

EasyRec能否在训练的同时查看模型训练结果？在哪里看模型的训练效果？

文章 2024-11-27 来自：开发者社区

Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

Qwen2.5-Coder 是阿里云最新推出的专门针对代码的 Qwen 大型语言模型系列。目前，Qwen2.5-Coder 覆盖了多种主流模型尺寸：0.5B、1.5B、3B、7B、14B 和 32B，以满足不同开发人员的需求。Qwen2.5-Coder 将训练 tokens 扩展到 5.5 万亿，在代码生成、代码推理和代码纠错能力方面有着显...

文章 2024-11-20 来自：开发者社区

DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

Qwen2（通义千问2）是阿里云研发的开源大型语言模型系列，具有很强的代码、数学、推理、指令遵循、多语言理解等能力。DistilQwen2 是阿里云人工智能平台 PAI 基于 Qwen2 大模型推出的、通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下&...

文章 2024-11-04 来自：开发者社区

浅谈机器学习，聊聊训练过程，就酱!

写在最前本故事讲的是关于机器学习的基本概念和训练过程。通过这个故事，你将对机器学习有一个直观的了解。随后，当你翻阅关于机器学习的书籍时，也许会有不同的感受。如果你有感觉到任督二脉被打通了，那我真是太高兴了。如果没有，我再努努力ﾍ(･_| 在这个 AI 内容生成泛滥的时代，依然有一批人"傻傻"坚持原创，如果您能读到最后，还请点赞或收藏或关注支持下我呗，感谢 (￣︶￣)↗ 机器学习是什么？...

文章 2024-10-11 来自：开发者社区

【机器学习】揭秘深度学习优化算法：加速训练与提升性能

学习目标知道常见优化方法的问题及解决方案传统的梯度下降优化算法中，可能会碰到以下情况：碰到平缓区域，梯度值较小，参数优化变慢碰到 “鞍点” ，梯度为 0，参数无法优化碰到局部最小值对于这些问题, 出现了一些对梯度下降算法的优化方法. 例如：Momentum、AdaGrad、RMSprop、Adam 等. 指数加权平均 ...

文章 2024-10-11 来自：开发者社区

【机器学习】揭秘反向传播：深度学习中神经网络训练的奥秘

学习目标知道梯度下降算法知道链式法则掌握反向传播算法多层神经网络的学习能力比单层网络强得多。想要训练多层网络，需要更强大的学习算法。误差反向传播算法（Back Propagation）是其中最杰出的代表，它是目前最成功的神经网络学习算法。...

共有326条

< 1 2 3 4 ... 33 >

跳转至： GO

更新时间 2025-03-13 12:47:08

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

人工智能平台 PAI更多训练相关

人工智能平台 PAI您可能感兴趣

产品推荐

热门帮助文档

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

+关注

热门技术解决方案

即刻拥有 QwQ-32B，性能比肩全球最强开源推理模型

QwQ-32B 模型具有强大的推理能力，其参数量约为 DeepSeek-R1 满血版的 1/21 且推理成本是后者的1/10，在数学、代码等核心指标（AIME 24/25、LiveCodeBench）达到 DeepSeek-R1 满血版水平。本方案介绍 QwQ-32B 的多种部署方式，用户可灵活选择，即开即用。

了解更多