文章 2025-07-11 来自:开发者社区

Post-Training on PAI (3):PAI-ChatLearn,PAI 自研高性能强化学习框架

作为模型后训练的重点技术领域,强化学习任务具备极高的复杂性,需要数据、算法、计算等诸多方面的高效协作,从而避免模型漂移、泛化能力下降等问题。尤其在企业应用过程中,强化学习阶段还需面临开发易用性和计算性能的双重挑战。 易用性挑战: 对新算法出现时的可扩展性,比如 同步和异步(on policy vs off policy),PPO 和 GRPO(是否需要 cr...

Post-Training on PAI (3):PAI-ChatLearn,PAI 自研高性能强化学习框架
文章 2025-06-26 来自:开发者社区

PAI-TurboX:面向自动驾驶的训练推理加速框架

一、技术背景 自动驾驶领域对高效且实时的数据处理能力提出了极高要求。如何优化深度学习模型的训练与推理流程,提升计算资源利用率,缩短模型迭代周期,并在保证精度的同时,实现低延迟、高吞吐量的部署,始终是行业面临的核心挑战。针对这些难题,PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理,提供了全方位的加速解决方案。这些方案不仅显著提升了感知、规划、控...

PAI-TurboX:面向自动驾驶的训练推理加速框架
文章 2025-06-26 来自:开发者社区

Post-Training on PAI (1):一文览尽开源强化学习框架在PAI平台的应用

DeepSeek-R1 通过 "Aha Moment" 场景的成功实践,充分验证了强化学习技术在大模型对齐领域的核心价值。这一突破推动开源社区迎来强化学习框架的创新热潮,各类工具如雨后春笋般涌现。 阿里云人工智能平台 PAI 深度拥抱开源生态,训练平台 PAI-DLC 全面整合主流强化学习框架与工具链,同时依托平台独有的大规模分布式训练能力, 极致性能优化及企业级稳定性保障,为企业及开发...

Post-Training on PAI (1):一文览尽开源强化学习框架在PAI平台的应用
文章 2025-05-28 来自:开发者社区

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

前言 知识蒸馏是一种将大模型的知识转移到小模型的方法,其核心思想是在不显著降低性能的前提下,通过训练将复杂的模型转化为更小、更高效的版本。通过这种方式,知识蒸馏不仅能够有效降低计算成本,还能够提高模型在资源受限环境中的适应性,从而为大规模应用提供可能。在此背景下,阿里云人工智能平台(PAI)推出了一款新的开源工具包——EasyDistill ,旨在简化大型语言模型的知识蒸馏过程,助力参数...

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身
文章 2025-05-11 来自:开发者社区

PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架

机器学习研究领域正经历着飞速发展,然而与此形成鲜明对比的是,已发表研究成果的代码实现往往缺失或难以获取。这种代码的缺失极大地阻碍了研究结果的可复现性,并减缓了科学进步的步伐。研究人员不得不投入大量时间和精力从论文中反向工程方法,这不仅效率低下,而且容易出错,最终阻碍了新思想的验证和进一步发展。据统计,在2024年顶级机器学习会议上发表的论文中,仅有极小一部分(例如21.23%)提供了相应的代码 ....

PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架
文章 2025-04-26 来自:开发者社区

PyTabKit:比sklearn更强大的表格数据机器学习框架

长期以来Scikit-Learn 一直作为表格数据机器学习的主流框架,它提供了丰富的算法、预处理工具和模型评估功能。尽管 Scikit-Learn 功能完备,但随着技术的发展,新兴框架 PyTabKit 正逐渐崭露头角。该框架专为表格数据的分类和回归任务设计,集成了 RealMLP 等先进技术以及优化的梯度提升决策树(GBDT)超参数配置,为表格数据处理提供了新的技术选择。 Scikit-Lea....

PyTabKit:比sklearn更强大的表格数据机器学习框架
文章 2025-03-19 来自:开发者社区

Java机器学习实战:基于DJL框架的手写数字识别全解析

引言:Java与AI的深度融合 在人工智能蓬勃发展的今天,Python凭借丰富的生态库(如TensorFlow、PyTorch)成为AI开发的首选语言。但Java作为企业级应用的基石,其在生产环境部署、性能优化和工程化方面的优势不容忽视。DJL(Deep Java Library)的出现完美填补了Java在深度学习领域的空白,它提供了一套统一的API,允许开发者无缝对接主流深度学习框架,...

阿里云文档 2025-01-14

部署机器学习模型服务框架KServe组件

KServe是一个基于Kubernetes的机器学习模型服务框架,支持以Kubernetes CRD的形式将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时,使得模型的部署、更新和扩展变得更加简单快捷。您可以在控制台安装KServe的核心组件,KServe Controller,以获得基于请求流量自动扩容等能力。

文章 2025-01-01 来自:开发者社区

Diff-Instruct:指导任意生成模型训练的通用框架,无需额外训练数据即可提升生成质量

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 原文链接:https://mp.weixin.qq.com/s/faeBUXbDsc-ZhIxmdTWOcw 快速阅读 功能:Diff-Instruct 能从预训练扩散模型中提取知识,指导...

Diff-Instruct:指导任意生成模型训练的通用框架,无需额外训练数据即可提升生成质量
文章 2024-09-07 来自:开发者社区

ML.NET:一个.NET开源、免费、跨平台的机器学习框架

前言 今天大姚给大家分享一个.NET开源、免费、跨平台(支持Windows、Linux、macOS多个操作系统)的机器学习框架:ML.NET。并且本文将会带你快速使用ML.NET训练一个属于自己的图像分类模型,对图像进行分类。 ...

ML.NET:一个.NET开源、免费、跨平台的机器学习框架

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注