文章 2025-10-03 来自:开发者社区

70_大模型服务部署技术对比:从框架到推理引擎

1. 引言:大模型部署的关键挑战 在2025年的大模型生态中,高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂,如何在有限的硬件资源下实现高性能、低延迟的推理服务,成为了所有大模型应用开发者面临的核心挑战。 从基础的Web框架到专业的推理引擎,大模型部署技术呈现出多样化...

70_大模型服务部署技术对比:从框架到推理引擎
文章 2025-09-13 来自:开发者社区

阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~

JManus 是阿里开源的Java版本的OpenManus,核心框架是Spring AI Alibaba 它能让Java 程序员更便捷地使用 AI 技术,支持多 Agent 框架、网页配置 Agent、MCP 协议和 PLAN-ACT 模式。可集成多个大模型,可调用阿里云百炼平台的模型,也可以使用本地ollama模型。 JManus 的核心特点包括 完美实现了 OpenM...

阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
文章 2025-08-07 来自:开发者社区

基于大模型的领域场景开发:从单智能体到多智能体的React框架设计与实现

背景 基于大模型的领域场景开发,说到底无非是借助基座模型对语义的理解推理能力,将通用AI变为专有AI工具的过程。但仅仅只做模型调用,来实现复杂类需求,对生产力的提升并没有太大帮助。因此在围绕提升研发生产力的过程,从大模型问世到现在,卷出了各种大模型工程规范。从最早的提示词工程到RAG,再到流程编排模式,每个阶段无疑都是对研发生产力的不断提升。 当然我们团队也经历了这些阶...

基于大模型的领域场景开发:从单智能体到多智能体的React框架设计与实现
文章 2025-08-01 来自:开发者社区

Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。免费订阅,与10万+技术人共享升级秘籍! Cradle 是由 BAAI‑Agents 团队开源的一款面向 通用计算机控制(GCC) 的多模态 AI Agent 框...

Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?
文章 2025-07-26 来自:开发者社区

四大主流AI Agent框架选型梳理

nine|践行一人公司开发、引擎、交付——基于Agent的倍速造产品流。正在记录从 0 到 1 的踩坑与突破,交付想法到产品的全过程。 随着AI技术的快速发展,多智能体系统(Multi-Agent)已成为企业智能化转型的关键技术。本文将梳理2025年7月值得关注的四大AI Agent框架(注:OpenAI Swarm属于学习...

四大主流AI Agent框架选型梳理
文章 2025-07-25 来自:开发者社区

Post-Training on PAI (5): PAI-EasyDistill, PAI 自研大模型蒸馏框架

一、PAI-EasyDistill 介绍 知识蒸馏是一种将大模型的知识转移到小模型的方法,其核心思想是在不显著降低性能的前提下,通过训练将复杂的模型转化为更小、更高效的版本。通过这种方式,知识蒸馏不仅能够有效降低计算成本,还能够提高模型在资源受限环境中的适应性,从而为大规模应用提供更多可能。 在此背景下,阿里云人工智能平台 PAI 推出自研大模型蒸馏框架——EasyDi...

Post-Training on PAI (5): PAI-EasyDistill, PAI 自研大模型蒸馏框架
文章 2025-07-15 来自:开发者社区

10+热门 AI Agent 框架深度解析:谁更适合你的项目?

⚠️ 选框架 ≠ 选最火! 真正能跑起来、跑得稳、跑得远的 Agent 框架,才是你的最优解。 为什么框架选型这么重要?架构选错,轻则性能差、调不动,重则成本高、推不动。 特别是 AI Agent,这不是一个“大模型 + 前端”的简单组合,而是任务分解、记忆管理、工具调度等模块的 复杂编排系...

10+热门 AI Agent 框架深度解析:谁更适合你的项目?
文章 2025-05-26 来自:开发者社区

基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充

后续补充 今天想起来写报告的时候突然发现项目起不来了,一查才发现原来hugging face一直是被ban的,所以在import 模型之前就要先换源。(昨天梯子发力了我说,这都能跑起来) import os # 在导入 SentenceTransformer 之前设置环境变量 os.environ['HF_ENDPOI...

基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
文章 2025-05-25 来自:开发者社区

基于neo4j数据库和dify大模型框架的rag模型搭建

本文主要讲述关于如何从pdf文档中提取数据并用于生成知识图谱,搭建基于知识图谱的rag模型的过程。 (其实就是知识库?有一说一因为根本没上课其实我也不知道我做的是啥,但是大概是符合课设要求的) 前置准备 neo4j数据库 neo4j用于存储从pdf文档中提取的数据。 安装方式有docker或者直接安装两种方式。 可以参考htt...

基于neo4j数据库和dify大模型框架的rag模型搭建
文章 2025-05-16 来自:开发者社区

RAG-MCP:基于检索增强生成的大模型工具选择优化框架

面对工具生态系统扩张,大型语言模型的工具选择能力因提示词膨胀而受限。RAG-MCP通过检索增强生成技术实现动态工具选择,显著提升处理效率与准确率。本文深入剖析其技术原理与应用价值。大型语言模型(LLMs)如GPT-4、Claude和Llama的发展标志着人工智能领域的重大突破。这些高级模型展现出卓越的文本生成、逻辑推理及编程能力。尽管技术先进,LLM仍然面临训练数据固化和上下文窗口有限的基础性约....

RAG-MCP:基于检索增强生成的大模型工具选择优化框架

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

+关注