阿里云文档 2026-04-27

在PAI-DSW中使用PPU进行单机模型训练-PG1阿里云产品-阿里云

本文为您介绍如何在PAI-DSW上使用PPU训练模型。

阿里云文档 2026-04-23

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

阿里云文档 2026-04-13

使用PAI完成DistilQwen2全链路最佳实践-人工智能平台 PAI-阿里云

DistilQwen2是阿里云人工智能平台PAI基于Qwen2大模型开发的精简语言模型。通过采用知识蒸馏技术,DistilQwen2提升了指令遵循能力,同时保持了较小的参数规模。该模型专为资源受限的环境设计,适用于移动设备和边缘计算场景,能够在显著降低计算资源需求和推理时间的同时,提供优异的性能表现。

阿里云文档 2026-04-09

快速开始:Qwen2.5-Coder模型的训练、评测、压缩与部署-人工智能平台 PAI-阿里云

Qwen2.5-Coder,亦称CodeQwen,是阿里云推出的、专注于代码相关任务的大语言模型系列。该系列包含六种模型尺寸(0.5B、1.5B、3B、7B、14B和32B),以满足不同开发者的多样化需求。Qwen2.5-Coder 基于海量代码数据进行训练,在保持强大数学和推理能力的同时,在以代码为中心的应用场景中表现卓越。本教程将以 Qwen2.5-Coder-32B-Instruct 模型为...

阿里云文档 2025-12-22

多模态大模型Pipeline构建:多模态数据处理与大模型训练实战指南

多模态模型预训练可提升跨模态理解与泛化能力,优化下游任务表现,适用于图像描述、视觉问答等跨模态任务。本方案以LLaVa多模态数据集和Qwen2-VL-7B-Instruct模型为例,介绍从数据准备、多模态模型预训练到服务部署的完整流程。

文章 2024-08-13 来自:开发者社区

【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战

一、引言 Gemma 是 Google 推出的轻量级、先进的开放模型系列,采用与 Gemini 模型相同的研究成果和技术构建而成。它们是仅使用解码器的文本到文本大型语言模型(提供英语版本),为预训练变体和指令调整变体具有开放权重。Gemma 模型非常适合各种文本生成任务,包括问题解答、摘要和推理。由于它们相对较小,因此可以将其部署在资源有限的环境(如笔记本电脑、桌面设备或您自己的云基础架...

【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
文章 2024-08-13 来自:开发者社区

【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战

一、引言 Qwen是阿里巴巴集团Qwen团队的大语言模型和多模态大模型系列。现在,大语言模型已升级到Qwen1.5,共计开源0.5B、1.8B、4B、7B、14B、32B、72B、110B共计8个Dense模型以及1个14B(A2.7B)的MoE模型。多模态大模型主要是Qwen-VL图像大模型以及Qwen-Audio语音大模型。为了保证文章质量,今天重点介绍Qwen大语言模型的原理、训练...

【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战
文章 2024-08-13 来自:开发者社区

【机器学习】Qwen2大模型原理、训练及推理部署实战

一、引言 刚刚写完【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战 ,阿里Qwen就推出了Qwen2,相较于Qwen1.5中0.5B、1.8B、4B、7B、14B、32B、72B、110B等8个Dense模型以及1个14B(A2.7B)MoE模型共计9个模型,Qwen2包含了0.5B、1.5B、7B、57B-A14B和72B共计5个尺寸模型。从尺寸上来讲,最关键的就是推出...

【机器学习】Qwen2大模型原理、训练及推理部署实战
问答 2024-08-07 来自:开发者社区

在机器学习PAI如果同一个特征离线训练用的和在线推理用,来源不一样,可以配置出来吗?

在机器学习PAI如果同一个特征离线训练用的和在线推理用,来源不一样,可以配置出来吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注