文章 2025-09-21 来自:开发者社区

RAG:增强大模型知识库的新范式

RAG:增强大模型知识库的新范式 检索增强生成(Retrieval-Augmented Generation)正在改变我们使用大语言模型的方式。与传统生成式模型不同,RAG通过引入外部知识源,有效解决了大模型的幻觉问题和知识滞后缺陷。 RAG的核心工作流程分为三个关键步骤:首先从知识库中检索相关文档,...

文章 2025-09-08 来自:开发者社区

切块、清洗、烹饪:RAG知识库构建的三步曲

嘿,各位AI技术爱好者们,你是不是经常遇到这样的情况:辛辛苦苦训练的AI助手,面对专业问题时却"一问三不知"或者"胡言乱语"?明明你已经喂了它一堆PDF和Word文档,为啥它就是不会用? 就像你去米其林餐厅,厨师拿着一堆未处理的食材直接上桌一样荒谬!没错,RAG系统也需要一个"厨房",而文档处理与知识库构建,就是这个厨房里最重要的"烹饪工艺"! RAG为什么需要文档处理? ...

切块、清洗、烹饪:RAG知识库构建的三步曲
高性能

文档智能与 RAG 构建 LLM 知识库

本方案介绍了如何实现将文档智能和检索增强生成(RAG)结合起来构建强大的 LLM 知识库,包括清洗文档内容、文档内容向量化、问答内容召回后通过特定的 Prompt,提供给 LLM 足够的上下文信息,以此来满足对于企业级文档类型知识库的问答处理。
技术解决方案背景图
文章 2025-09-04 来自:开发者社区

AI 网关代理 RAG 检索:Dify 轻松对接外部知识库的新实践

作者:赵源筱、王灏廷 Dify 是一款开源的 AI 应用开发平台,旨在帮助开发者和非技术人员快速构建和运营基于生成式 AI 的应用。截至目前,Dify 开源 Star 数量已经突破 11 万,具有庞大的用户群体,已成为构建生成式 AI 应用的热门选择之一。 然而,随着 Dify 在实际生产实践中持续落地,根据云上客户以及社区反馈,其内置的 RAG 引擎逐渐暴露...

AI 网关代理 RAG 检索:Dify 轻松对接外部知识库的新实践
文章 2025-08-28 来自:开发者社区

从青铜到王者,DeepSeek+Spring AI 搭建 RAG 知识库

一、RAG 知识库:解锁精准问答的新姿势 在人工智能飞速发展的当下,大语言模型(LLMs)已广泛应用于各种自然语言处理任务。但它们也存在一些局限性,如 “幻觉” 问题,即生成的内容可能与事实不符或缺乏足够的准确性。为了解决这些问题,检索增强生成(Retrieval-Augmented Generation,RAG)技术应运而生。 RAG 技术的核心在于将检索与生成相结合。传统的生...

从青铜到王者,DeepSeek+Spring AI 搭建 RAG 知识库
文章 2025-08-18 来自:开发者社区

构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库

现代RAG(Retrieval-Augmented Generation)和智能体架构在处理问答任务时,依赖于能够随时间动态更新的知识库,这类知识库通常包含财务报告、技术文档等持续变化的信息。为确保推理和规划过程的逻辑性与准确性,需要建立相应的时序管理机制。 针对规模不断增长且存在幻觉风险的动态知识库,需要构建一个独立的逻辑-时序(时间感知)智能体管道来管理AI产品中的演进知识库。该管道的核心组....

构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
文章 2025-07-25 来自:开发者社区

使用PAI LangStudio创建RAG知识库及联网搜索聊天机器人

我们知道PAI还有LangStudio,类似百炼、Coze、Dify的工作流机制。下面我们使用LangStudio来创建知识库和联网搜索聊天机器人。基于LangStudio&DeepSeek的RAG及联网搜索聊天机器人解决方案 SerpAPI注册 首先,请先去serpapi.com注册账号。 部署LLM和Embedding模型 该步骤可以直接使用Model Gallery部署,请参考自建....

文章 2025-06-27 来自:开发者社区

智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错

上几篇内容介绍了基于RAG实现简单的知识库问答功能及优化,本篇文章基于原有功能做下输入内容的纠错。实现的功能是输入一段文字,从本地知识库中检索信息进行比对并提示其中的错误。一、具体的功能实现 代码实现逻辑还是从本地加载知识源数据,进行文本分隔和嵌入,然后存入向量数据库中。相关的代码已经在前几篇文章中有介绍,可以参考。1....

智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错
文章 2025-06-24 来自:开发者社区

智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化

上一篇介绍了基于RAG实现简单的知识库问答功能,使用了两个向量数据库Chroma和FAISS,测试了功能情况。这篇文章继续优化,引入开源嵌入大模型all-MiniLM-L6-v2,并改造为先用大模型回答,再根据问题关键词从内部知识库查询问答结果。一、嵌入大模型all-MiniLM-L6-v2介绍all - MiniLM - L...

智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化
文章 2025-06-23 来自:开发者社区

智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答

上一篇介绍了接入大模型输出结果,实现了基本的问答功能。现有大模型都是基于公开资料训练的,搜索垂直专业领域的知识可能会出现问题。本篇文章会基于RAG实现简单的知识库问答功能。一、RAG介绍 RAG(Retrieval Augmented Generation)即检索增强生成,是一种结合了信息检索和大语言模型(...

智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
文章 2025-06-17 来自:开发者社区

【开源项目】MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统

MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统 开箱即用、灵活的RAG知识库加工作流聊天机器人 MaxKB4j = Max Knowledge Base for Java,是一款基于Java语言开发的LLM工作流应用和 RAG 的开源LLMOps平台,项目主要借鉴了MaxKB和FastGPT,并将两个的优势结合到一个项目上ÿ...

【开源项目】MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。