阿里云文档 2024-09-05

使用EAS部署LLM大语言模型

$stringUtil.substring( $!{XssContent1.description},200)...

阿里云文档 2024-08-27

使用TensorRT-LLM部署Qwen2模型推理服务

本文以Qwen2-1.5B-Instruct模型、GPU类型为A10卡为例,演示如何在ACK中使用Triton推理服务 + TensorRT-LLM部署通义千问模型推理服务。模型部署过程中使用Fluid Dataflow完成模型准备工作,并使用Fluid提升模型加载速度。

阿里云文档 2024-08-26

在GPU云服务器上快速部署TensorRT-LLM以构建大语言模型的推理环境

在GPU的实例上安装推理引擎TensorRT-LLM,可以帮助您快速且方便地构建大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或通义千问Qwen模型)的推理环境,主要应用在智能对话系统、文本分析等自然语言处理业务场景。本文为您介绍如何在GPU实例上安装和使用TensorRT-LLM来快速构建大语言模型的高性能推理优化功能。

文章 2024-08-16 来自:开发者社区

Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程

$stringUtil.substring( $!{XssContent1.description},200)...

Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
阿里云文档 2024-08-09

通过EAS部署LLM大语言模型

EAS提供了场景化部署方式,您只需配置几个参数,即可一键部署流行的开源LLM大语言模型服务应用,以获得大模型的推理能力。本文为您介绍如何通过EAS一键部署和调用LLM大语言模型服务,以及常见的问题和解决方法。

阿里云文档 2024-07-26

基于ACK使用rtp-llm部署Qwen模型推理服务

本文以Qwen1.5-4B-Chat模型、GPU类型为A10和T4卡为例,演示如何在ACK中使用rtp-llm框架部署通义千问(Qwen)模型推理服务。

文章 2023-12-26 来自:开发者社区

魔搭社区LLM模型部署实践, 以ChatGLM3为例(一)

$stringUtil.substring( $!{XssContent1.description},200)...

魔搭社区LLM模型部署实践, 以ChatGLM3为例(一)
文章 2023-12-26 来自:开发者社区

魔搭社区LLM模型部署实践, 以ChatGLM3为例(二)

$stringUtil.substring( $!{XssContent1.description},200)...

魔搭社区LLM模型部署实践, 以ChatGLM3为例(二)
文章 2023-11-13 来自:开发者社区

魔搭社区LLM模型部署实践 —— 以ChatGLM3为例

本文将以ChatGLM3-6B为例,介绍在魔搭社区如何部署LLM,主要包括如下内容:SwingDeploy - 云端部署,实现零代码一键部署多端部署 - MAC个人笔记本,CPU服务器定制化模型部署 - 微调后部署SwingDeploy - 云端部署,零代码一键部署魔搭社区SwingDeploy链接:...

魔搭社区LLM模型部署实践 —— 以ChatGLM3为例

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"productCardStyle","productCode":"aliyun","productCardInfo":{"productTitle":"文档智能&RAG,让你的AI大模型开启“外挂”之旅","productDescription":"本方案介绍了如何实现将文档智能和检索增强生成(RAG)结合起来构建强大的LLM知识库,包括清洗文档内容、文档内容向量化、问答内容召回后通过特定的Prompt,提供给LLM足够的上下文信息,以此来满足对于企业级文档类型知识库的问答处理。","productContentLink":"https://www.aliyun.com/solution/tech-solution/document-mind-rag-for-llm","isDisplayProductIcon":true,"productButton1":{"productButtonText":"方案详情","productButtonLink":"https://www.aliyun.com/solution/tech-solution/document-mind-rag-for-llm"},"productButton2":{"productButtonText":"一键部署","productButtonLink":"https://help.aliyun.com/document_detail/2845368.html"},"productButton3":{"productButtonText":"查看更多技术解决方案","productButtonLink":"https://www.aliyun.com/solution/tech-solution/"},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"解决方案推荐","productPromotionInfoFirstText":"10分钟在网站上增加一个 AI 助手","productPromotionInfoFirstLink":"https://www.aliyun.com/solution/tech-solution/add-an-ai-assistant-to-your-website-in-10-minutes","productPromotionInfoSecondText":"10 分钟构建 AI 客服并应用到网站、钉钉或微信中","productPromotionInfoSecondLink":"https://www.aliyun.com/solution/tech-solution/build-a-chatbot-for-your-website-or-chat-system"}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock"}}