LLM引擎的相关内容

文章 2025-02-25 来自：开发者社区

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、近零开销

在大型语言模型（LLM）的研究领域，如何高效地生成结构化输出一直是一个关键挑战。近期，陈天奇团队提出了一种名为XGrammar的新型结构化生成引擎，该引擎旨在解决这一问题，并取得了显著的成果。 XGrammar的核心创新在于其对词汇的分类和处理方式。它将词汇分为上下文无关和上下文相关两类。对于上下文无关的词汇&#...

文章 2024-11-28 来自：开发者社区

XGrammar：陈天奇团队推出的LLM结构化生成引擎

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读主题：XGrammar是一个为LLM提供结构化生成能力的开源库。功能：支持上下文无关语法，适用于生成JSON、SQL等格式数据。优化：通过字节级下推自动机实现百倍加速，几乎无额外开销...

阿里云文档 2024-10-25

大语言模型（ LLM）的推理引擎DeepGPU-LLM

DeepGPU-LLM是阿里云研发的基于GPU云服务器的大语言模型（Large Language Model，LLM）的推理引擎，在处理大语言模型任务中，该推理引擎可以为您提供高性能的大模型推理服务。

文章 2024-07-08 来自：开发者社区

LLM推理引擎怎么选？TensorRT vs vLLM vs LMDeploy vs MLC-LLM

LLM擅长文本生成应用程序，如聊天和代码完成模型，能够高度理解和流畅。但是它们的大尺寸也给推理带来了挑战。有很多个框架和包可以优化LLM推理和服务，所以在本文中我将整理一些常用的推理引擎并进行比较。 TensorRT-LLM TensorRT-LLM是NV发布的一个推理引擎。llm被编译成TensorRT后与triton服务器一起部署并支持多GPU-多节点推理和FP8。我们将比较HF...

文章 2023-09-04 来自：开发者社区

OpenPPL-LLM | OpenPPL之大语言模型推理引擎来啦

自 OpenAI 发布 ChatGPT 以来，基于 Transformer 架构的大语言模型(LLM)在全球范围内引发了深度的技术关注和广泛的实践应用。其强大的理解和生成能力，正在深刻改变我们对人工智能的认知和应用。然而大语言模型的推理应用成本过高，高昂的成本大大阻碍了技术落地。OpenPPL 一直致力于提供高性能多后端深度学习推理部署服务。面对推理部署大语言模型的新需求，我们结合原有 Open....

文章 2023-05-31 来自：开发者社区

LLM推理提速2.8倍，CMU清华姚班校友提出「投机式推理」引擎SpecInfer，小模型撬动大模型高效推理

近日，来自卡耐基梅隆大学（CMU）的 Catalyst Group 团队发布了一款「投机式推理」引擎 SpecInfer，可以借助轻量化的小模型来帮助大模型，在完全不影响生成内容准确度的情况下，实现两到三倍的推理加速。随着 ChatGPT 的出现，大规模语言模型（LLM）研究及其应用得到学术界和工业界的广泛关注。一方面，开源的 LLM 模型不断涌现，比如 OPT、BLOOM、LLaMA 等，这些....

文章 2023-05-25 来自：开发者社区

神奇LLM引擎上线：帮你把GPT-3直接调成ChatGPT

OpenAI 花几个月完成的事，现在用它直接给你自动化了。最近一段时间，不论大公司还是开发者都在造大语言模型（LLM），但有人认为，大模型应用的速度有点落后。为了构建能实际使用的 AI 工具，我们需要基于基础模型构建定制化模型，中间的过程包含微调（Fine-tuning），这是一个复杂且耗时的过程，对于很多人来说，简便易行的调试是不存在的。这个问题现在或许得到了解决：本周六，来自斯坦福的一群开发....

共有7条

< 1 >

跳转至： GO

更新时间 2025-02-26 12:47:29

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

LLM更多引擎相关

LLM您可能感兴趣

产品推荐

{"cardStyle":"productCardStyle","productCode":"kvstore","productCardInfo":{"productTitle":"Tair KVCache","productDescription":"阿里云数据库 Tair KVCache 为 LLM 推理提供分布式动态分级缓存服务，通过软硬协同设计实现存储资源的最优调度，优化 GPU 服务器资源利用率的同时提升 LLM 服务的速度和吞吐性能，实现降本增效。","productContentLink":"https://www.aliyun.com/product/kvcache","isDisplayProductIcon":true,"productButton1":{"productButtonText":"了解详情","productButtonLink":"https://www.aliyun.com/product/kvcache"},"productButton2":{"productButtonText":"立即咨询","productButtonLink":"https://page.aliyun.com/form/act176452088/index.htm?spm=5176.30063692.J__Z58Z6CX7MY__Ll8p1ZOR.1.66a55ac316TezL"},"productButton3":{"productButtonText":"","productButtonLink":""},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"最新活动","productPromotionInfoFirstText":"","productPromotionInfoFirstLink":"","productPromotionInfoSecondText":"邀请试用","productPromotionInfoSecondLink":"https://page.aliyun.com/form/act176452088/index.htm?spm=5176.30063692.J__Z58Z6CX7MY__Ll8p1ZOR.3.66a55ac316TezL"},{"$id":"1","productPromotionGroupingTitle":"快速入门","productPromotionInfoFirstText":"Tair KVCache 产品介绍","productPromotionInfoFirstLink":"https://help.aliyun.com/zh/redis/product-overview/tair-kvcache?spm=5176.30063692.J_zhz1C6uKKPBvN1fur6xih.1.b87b5ac3Iu5Wen#ef4997358dmto","productPromotionInfoSecondText":"","productPromotionInfoSecondLink":""},{"$id":"2","productPromotionGroupingTitle":"产品动态","productPromotionInfoFirstText":"","productPromotionInfoFirstLink":"","productPromotionInfoSecondText":"Tair KVCache推理加速解决方案","productPromotionInfoSecondLink":"https://developer.aliyun.com/article/1658082"},{"$id":"3","productPromotionGroupingTitle":"产品推荐","productPromotionInfoFirstText":"云数据库 Tair（兼容 Redis®*）","productPromotionInfoFirstLink":"https://www.aliyun.com/product/tair","productPromotionInfoSecondText":"","productPromotionInfoSecondLink":""}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock"}}

Tair KVCache

阿里云数据库 Tair KVCache 为 LLM 推理提供分布式动态分级缓存服务，通过软硬协同设计实现存储资源的最优调度，优化 GPU 服务器资源利用率的同时提升 LLM 服务的速度和吞吐性能，实现降本增效。