阿里云文档 2026-04-27

在PAI-DSW中使用PPU进行单机模型训练-PG1阿里云产品-阿里云

本文为您介绍如何在PAI-DSW上使用PPU训练模型。

阿里云文档 2026-04-23

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

阿里云文档 2026-04-13

使用PAI完成DistilQwen2全链路最佳实践-人工智能平台 PAI-阿里云

DistilQwen2是阿里云人工智能平台PAI基于Qwen2大模型开发的精简语言模型。通过采用知识蒸馏技术,DistilQwen2提升了指令遵循能力,同时保持了较小的参数规模。该模型专为资源受限的环境设计,适用于移动设备和边缘计算场景,能够在显著降低计算资源需求和推理时间的同时,提供优异的性能表现。

阿里云文档 2026-04-09

快速开始:Qwen2.5-Coder模型的训练、评测、压缩与部署-人工智能平台 PAI-阿里云

Qwen2.5-Coder,亦称CodeQwen,是阿里云推出的、专注于代码相关任务的大语言模型系列。该系列包含六种模型尺寸(0.5B、1.5B、3B、7B、14B和32B),以满足不同开发者的多样化需求。Qwen2.5-Coder 基于海量代码数据进行训练,在保持强大数学和推理能力的同时,在以代码为中心的应用场景中表现卓越。本教程将以 Qwen2.5-Coder-32B-Instruct 模型为...

阿里云文档 2025-12-22

多模态大模型Pipeline构建:多模态数据处理与大模型训练实战指南

多模态模型预训练可提升跨模态理解与泛化能力,优化下游任务表现,适用于图像描述、视觉问答等跨模态任务。本方案以LLaVa多模态数据集和Qwen2-VL-7B-Instruct模型为例,介绍从数据准备、多模态模型预训练到服务部署的完整流程。

文章 2025-03-15 来自:开发者社区

MT-MegatronLM:国产训练框架逆袭!三合一并行+FP8黑科技,大模型训练效率暴涨200%

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 ⚡ "还在为千亿模型训练烧钱?国产框架让8卡GPU跑出8...

MT-MegatronLM:国产训练框架逆袭!三合一并行+FP8黑科技,大模型训练效率暴涨200%
文章 2024-09-10 来自:开发者社区

训练集、测试集与验证集:机器学习模型评估的基石

在机器学习中,为了评估模型的性能,我们通常会将数据集划分为训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)。这种划分有助于我们更好地理解模型在不同数据上的表现,并据此调整模型参数,避免过拟合和欠拟合。本文将详细介绍这三个集合的作用,并通过代码演示如何进行数据集的划分。 目录 一、训练集、验证集与测试集的作用 二、为什么...

训练集、测试集与验证集:机器学习模型评估的基石
文章 2024-08-31 来自:开发者社区

深度解析 Uno Platform 离线状态处理技巧:从网络检测到本地存储同步,全方位提升跨平台应用在无网环境下的用户体验与数据管理策略

处理离线状态下的用户体验是任何现代应用开发中不可或缺的一部分。当用户在网络连接不稳定或完全断开的情况下使用应用时,仍能提供良好的用户体验至关重要。Uno Platform 作为一个强大的跨平台框架,为开发者提供了多种手段来应对这一挑战。本文将通过一个具体的案例——在线笔记应用——来探讨如何在 Uno Platform 中优雅地处理离线状态,并提供示例代码...

文章 2024-08-31 来自:开发者社区

分布式训练在TensorFlow中的全面应用指南:掌握多机多卡配置与实践技巧,让大规模数据集训练变得轻而易举,大幅提升模型训练效率与性能

分布式训练是解决大规模数据集训练问题的有效手段,尤其在深度学习领域,模型复杂度和数据量的增加使得单机训练变得不切实际。TensorFlow 提供了强大的分布式训练支持,使得开发者能够利用多台机器的计算资源来加速模型训练。本文将以最佳实践的形式,详细介绍如何在 TensorFlow 中实施分布式训练,并通过具体示例代码展示其实现...

问答 2024-08-13 来自:开发者社区

ModelScope中,以本地模型为原型训练模型怎么实现,能用.gguf格式的模型训练吗?

ModelScope中,以本地模型为原型训练模型怎么实现,能用.gguf格式的模型训练吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注