文章 2025-10-03 来自:开发者社区

53_多模态LLM:图像理解的新范式

深度探索视觉-语言融合技术与应用 多模态LLM发展历程 ├── 单模态时代(2000年前): OCR文字识别、语音识别独立发展 ├── 早期融合尝试(2010s): 视频弹幕与画面时间轴对齐技术 ├── 深度学习突破(2020s): CLIP模型实现图文跨模态检索,准确率提升40% └── 大模型时代(2024-2025): GPT-4o支持10种模态输入,实现动态权...

53_多模态LLM:图像理解的新范式
文章 2025-09-18 来自:开发者社区

​​LLM推理效率的范式转移:FlashAttention与PagedAttention正在重塑AI部署的未来​

本文较长,建议点赞收藏,以免遗失。 在大语言模型(LLM)的推理过程中,Attention机制是计算和内存消耗的主要瓶颈。FlashAttention和PagedAttention作为两项革命性优化技术,分别从计算效率和内存管理两个维度显著提升了LLM的推理性能。今天我将深度解析这两种注意力加速技术及其优化策略...

​​LLM推理效率的范式转移:FlashAttention与PagedAttention正在重塑AI部署的未来​
文章 2025-09-14 来自:开发者社区

LLM智能体设计手册:14项关键技术构建下一代智能体新范式

本文较长,建议点赞收藏,以免遗失。 随着大语言模型(LLM)的 AI 智能体正在快速发展,逐渐超越传统对话式 LLM 的能力边界。这些智能体的强大功能依赖于多个组件的协同工作。今天我将带大家深入探索 AI 智能体的架构设计、关键技术及核心组成部分。 我们将重点关注14项关键技术:LLM智能体的基本概念、记忆机...

LLM智能体设计手册:14项关键技术构建下一代智能体新范式
文章 2025-04-26 来自:开发者社区

RAGEN:RL训练LLM推理新范式!开源强化学习框架让Agent学会多轮决策

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 「RL训练LLM推理新范式!开源框架让Agent学会多...

RAGEN:RL训练LLM推理新范式!开源强化学习框架让Agent学会多轮决策
文章 2025-03-10 来自:开发者社区

关于LLM-as-a-judge范式,终于有综述讲明白了

在人工智能(AI)和自然语言处理(NLP)领域,评估和判断一直都是关键性难题。传统方法,无论是基于匹配还是基于嵌入,在处理细微属性和提供满意结果方面都存在不足。然而,随着大型语言模型(LLM)的最新进展,一种名为"LLM-as-a-ju...

文章 2025-02-28 来自:开发者社区

企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南

DeepSeek凭借其出色的推理表现在春节期间火爆全网,本文重点介绍如何在阿里云容器服务ACK中使用KServe部署生产可用的DeepSeek模型推理服务。 背景介绍 1. DeepSeek R1模型 DeepSeek-R1[1]模型是DeepSeek推出的第一代推理模型,旨在通过大规模强化学习提升大语言模型的推理能力。实验结果表明,Deep...

企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
文章 2025-02-08 来自:开发者社区

企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南

【阅读原文】戳:企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南 DeepSeek凭借其出色的推理表现在春节期间火爆全网,本文重点介绍如何在阿里云容器服务ACK中使用KServe部署生产可用的DeepSeek模型推理服务。       背景介绍   ...

企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
文章 2024-09-07 来自:开发者社区

CPU反超NPU,llama.cpp生成速度翻5倍!LLM端侧部署新范式T-MAC开源

随着大型语言模型(LLM)在智能设备上的广泛应用,如何在资源受限的边缘设备上高效部署LLM成为了一个关键问题。最近,微软研究院提出了一种名为T-MAC的创新方法,通过查表法(LUT)在CPU上实现低比特LLM(即权重量化LLM)的高效推理。T-MAC直接支持混合精度矩阵乘...

文章 2023-07-12 来自:开发者社区

谈谈LLM在推荐域的渗透,探索推荐新范式

来源|阿里开发者公众号作者|葬青前言最近大模型真的很火,从个人到公司,各行各业都在学习大模型、总结大模型和尝试应用大模型。大模型其实不是一个新的产物,已经在NLP发展了很多年。ChatGPT的诞生,经验的效果震惊了所有人,虽然也有一些瑕疵,但是瑕不掩瑜。微软投资OpenAI看到了它的未来。微软快速围绕ChatGPT对相关的产品进行了产品升级,从搜索到微软365各种产品。5.29号有机会和部门的一....

谈谈LLM在推荐域的渗透,探索推荐新范式
文章 2023-06-30 来自:开发者社区

仅使用解码器实现语音翻译,字节跳动提出基于LLM的新范式PolyVoice

近年来,大规模语言模型(LLMs)建模在 NLP 领域取得了许多突破,特别是 ChatGPT 的成功,正引领大家迈入一个新的 AI 时代。截止目前,基于 encoder-decoder 框架的模型在语音处理任务中仍占主导地位,而基于语言模型(LM)的方法还处于初期探索阶段。AudioLM 和 VALL-E 作为前期工作已经证明了利用离散语义单元(Semantic Units)和离散声学单元(Ac....

仅使用解码器实现语音翻译,字节跳动提出基于LLM的新范式PolyVoice

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。