文章 2025-10-03 来自:开发者社区

115_LLM基础模型架构设计:从Transformer到稀疏注意力

1. 引言 大型语言模型(LLM)的架构设计是其性能的核心决定因素。从2017年Transformer架构的提出,到如今的稀疏注意力和混合专家模型,LLM架构经历了快速的演进。本文将全面探讨LLM基础架构的设计原理,深入分析Transformer的核心机制,详细介绍稀疏注意力、MoE等创新架构,并展...

115_LLM基础模型架构设计:从Transformer到稀疏注意力
文章 2025-09-27 来自:开发者社区

告别只会写提示词:构建生产级LLM系统的完整架构图​

本文较长,建议点赞收藏,以免遗失。 很多人一听到 LLM 就只想到“提示词工程”。认为写好prompt就够了,可当你去面试AI产品经理岗位时,你才会发现远不止“写提示词”这么简单。对于企业生产级系统要求工程化、部署、优化与可观测性形成闭环,否则模型在真实场景里很容易翻车。今天我将总结一下掌握LLM产品的实现路径。 一、提示词...

告别只会写提示词:构建生产级LLM系统的完整架构图​
文章 2025-07-02 来自:开发者社区

三核驱动!AI Agent+LLM+RAG 架构演进, 来一次AI架构的大白话+深度解读

原文地址 原文地址 尼恩:LLM大模型学习圣经PDF的起源 在40岁老架构师 尼恩的读者交流群(50+)中,经常性的指导小伙伴们改造简历。 经过尼恩的改造之后,很多小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试机会,拿到了大厂机会。 接下来,尼恩架构团队,通过 梳理一个《LLM大模型学习圣经》 帮助更多的人做LLM架构,拿到年薪100W, 这个内容体系包括....

三核驱动!AI Agent+LLM+RAG 架构演进, 来一次AI架构的大白话+深度解读
文章 2025-07-02 来自:开发者社区

使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理

TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新 LLM 完成应用原型验证与产品部署。TensorRT-LLM 提供了一个全面的开源 SDK,用于加速和优化 LLM 推理,包含了最新极致优化的计算 Kernel、高性能 Attention 实现、多机多卡通信分布式支持、丰富的并行和量化策略等,从而在 NVIDIA GPU 上实现突破性....

使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理
文章 2024-10-11 来自:开发者社区

【AI大模型】BERT模型:揭秘LLM主要类别架构(上)

LLM主要类别 LLM本身基于transformer架构。自2017年,attention is all you need诞生起,原始的transformer模型为不同领域的模型提供了灵感和启发。基于原始的Transformer框架,衍生出了一系列模型,一些模型仅仅使用encoder或dec...

【AI大模型】BERT模型:揭秘LLM主要类别架构(上)
文章 2024-09-09 来自:开发者社区

Transformer、RNN和SSM的相似性探究:揭示看似不相关的LLM架构之间的联系

通过探索看似不相关的大语言模型(LLM)架构之间的潜在联系,我们可能为促进不同模型间的思想交流和提高整体效率开辟新的途径。 尽管Mamba等线性循环神经网络(RNN)和状态空间模型(SSM)近来备受关注,Transformer架构仍然是LLM的主要支柱。这种格局可能即将发生变化:像Jamba、Samba和Griffin这样的混合架构展现出了巨大的潜力。这些模型在时间和内存效率方面明显优于Tra.....

Transformer、RNN和SSM的相似性探究:揭示看似不相关的LLM架构之间的联系
文章 2024-07-21 来自:开发者社区

人工智能LLM问题之推荐系统的架构流程图如何解决

问题一:推荐系统的架构有没有什么流程图 推荐系统的架构有没有什么流程图 参考回答: 你想要的是这个吧 关于本问题的更多回答可点击原文查看:https://developer.ali...

人工智能LLM问题之推荐系统的架构流程图如何解决
文章 2024-06-22 来自:开发者社区

LLM主要类别架构(二)

LLM主要类别架构(一)+https://developer.aliyun.com/article/1544832?spm=a2c6h.13148508.setting.15.22454f0e4mZEBN 3 自回归模型 自回归模型 (Autoregressive model,AR) ,代表作GPT,其特点为:Decoder-Only,基本原理:从左...

LLM主要类别架构(二)
文章 2024-06-22 来自:开发者社区

LLM主要类别架构(一)

LLM主要类别架构介绍 LLM主要类别 LLM本身基于transformer架构。transformer模型为不同领域的模型提供了灵感和启发。基于原始的Transformer框架,衍生出了一系列模型,一些模型仅仅使用encoder或decoder,有些模型同时使encoder+decoder。 LLM分类一般分为三种:自编码模型(encode...

文章 2024-05-13 来自:开发者社区

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

最近,一项名为LongRoPE的研究在大型语言模型(LLM)领域引起了广泛关注。这项研究由Li Lyna Zhang等人提出,旨在解决LLM中上下文窗口长度受限的问题。上下文窗口是指模型在理解和生成文本时能够参考的历史文本长度,通常情况下,由于计算资源和训练数据的限制,LLM的上下文窗口长度被限制在...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。