使用DeepSeek-R1模型搭建RAG系统
DeepSeek-R1系列模型是一款专注于复杂推理任务的大语言模型,在复杂指令理解、推理结果准确性、性能稳定性等方面相比其他大语言模型,有一定优势。OpenSearch LLM智能问答版已集成DeepSeek-R1系列模型,进一步提升企业级RAG效果,本文向您介绍使用步骤。
使用DeepGPU-LLM镜像构建模型的推理环境
在GPU实例上配置DeepGPU-LLM容器镜像后,可以帮助您快速构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析、编程辅助等自然语言处理业务场景,您无需深入了解底层的硬件优化细节,镜像拉取完成后,无需额外配置即可开箱即用。本文为您介绍如何在GPU实例上使用DeepGPU-LLM容器镜像构建大语言模型的...
使用ASM回退功能构建高可用的LLM服务
在LLM场景中,业务应用需要对接内部或外部的基础模型服务。服务网格 ASM(Service Mesh)支持同时对接多个基础模型服务,并且可以实现当一个模型服务不可用时,自动回退到另一个模型服务,助力企业实现LLM应用的高可用。本文介绍如何在对接LLM服务时使用流量回退功能。
72_监控仪表盘:构建LLM开发环境的实时观测系统
1. 引言:LLM开发中的监控挑战 在2025年的大模型(LLM)开发实践中,实时监控已成为确保模型训练效率和生产部署稳定性的关键环节。与传统软件开发不同,LLM项目面临着独特的监控挑战: 训练过程复杂:LLM训练周期长、资源消耗大,需要实时监控训练进度、损失函数变化、资源利用率等关键指标实验迭代频繁...
告别只会写提示词:构建生产级LLM系统的完整架构图
本文较长,建议点赞收藏,以免遗失。 很多人一听到 LLM 就只想到“提示词工程”。认为写好prompt就够了,可当你去面试AI产品经理岗位时,你才会发现远不止“写提示词”这么简单。对于企业生产级系统要求工程化、部署、优化与可观测性形成闭环,否则模型在真实场景里很容易翻车。今天我将总结一下掌握LLM产品的实现路径。 一、提示词...
如何通过云上数据库一站式构建RAG系统
随着AIGC技术日新月异的发展,LLM应用也在持续迭代,检索增强生成(RAG)系统已经成为企业知识库、智能客服、电商导购等场景的核心环节。阿里云OpenSearch-LLM智能问答版联合数据集成Data Integration产品,帮助企业和开发者实现分钟级构建专属RAG系统。本教程介绍如何通过云上数据库一站式构建RAG系统。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。