文章 2025-06-20 来自:开发者社区

【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型

MiniMax-M1 模型是由 MiniMax 公司6月17日全新推出的大语言模型,使用 hybrid Mixture-of-Experts (MoE) 架构,并使用了 lightning attention 机制。 MiniMax 公司称其为世界上第一个开源的大规模混合架构的推理模型。 MiniMax-M1  模型原生支持 1 百万个 token 的上下文长度, 并...

【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
文章 2025-05-22 来自:开发者社区

Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1

NVIDIA Cosmos 是一个世界基础模型(WFMs, world foundation models)开发平台,用于推动物理 AI 的发展,包含先进的视觉标记器、护栏以及加速视频数据处理工具管线。它专为加速智能驾驶汽车和机器人领域的合成数据生成、AI 模型训练与评估而设计。 本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PA...

Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
文章 2025-04-29 来自:开发者社区

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Ste....

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit
文章 2025-04-17 来自:开发者社区

基于PAI+专属网关+私网连接:构建全链路Deepseek云上私有化部署与模型调用架构

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异,市场反馈火爆。在大模型技术商业化进程中,企业级用户普遍面临四大核心挑战: 算力投入成本高昂:构建千亿参数级模型的训练与推理集群需巨额开支,导致中小企业难以跨越技术准入门槛; 算力资源供应紧张:一线城市GPU集群受限于硬件供应短缺与资源抢占激烈,算力资源不足; ...

基于PAI+专属网关+私网连接:构建全链路Deepseek云上私有化部署与模型调用架构
文章 2025-03-27 来自:开发者社区

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

DeepSeek 近期推出了“DeepSeek-V3-0324”版本,据测试在数学推理和前端开发方面的表现已优于 Claude 3.5 和 Claude 3.7 Sonnet。 阿里也推出了多模态大模型 Qwen2.5-VL 的新版本--“Qwen2.5-VL-32B-Instruct”,32B参数量实现72B级性能,通杀图文问答/视觉推理场景,解决了「72B 对 VLM 来说...

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B
文章 2025-02-05 来自:开发者社区

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型

一、DeepSeek-V3、R1 系列模型 DeepSeek-V3 是 DeepSeek 发布的 MoE(Mixture-of-Experts)大语言模型,总参数量为671B,每个 token 激活的参数量为37B。为了实现高效的推理和成本效益的训练,DeepSeek-V3 采用了 MLA(Multi-head Latent Attention)和 DeepSeekMoE 架构。此外,D...

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
文章 2025-01-03 来自:开发者社区

PAI训练服务:云上大模型训练新篇章

一、general AI时代的新训练 在general AI的情况下,我们会有很多新的变化,根据这张图,我们做了一个简单的概括,从训练来说,我们常规的认为在AI中数据、算力和算法这三个是迭代上升的过程,在今天general AI情况下,我们发现算力已经不仅仅是GPU卡的问题。我们看到尤其是在大模型时代下,整个算力的变化极大,比如我们有国产的各种各样的芯片出来,有nv的各种各样迭...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注