文章 2025-01-16 来自:开发者社区

为RTP-LLM提供Arm CPU后端,助力Arm

为RTP-LLM提供Arm CPU后端,助力Arm   RTP LLM 是一个大语言模型推理和加速的引擎,主要是用 C++ 和 Python 编写的,它在阿里巴巴的电商平台得到了生产环境的部署和应用。在性能上,最原始的后端是基于 GPU 扩大的高性能内核,可以达到一个业界领先...

为RTP-LLM提供Arm CPU后端,助力Arm
文章 2024-10-21 来自:开发者社区

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

在人工智能(AI)领域,硬件的能源消耗一直是一个备受关注的问题。然而,最近发表在《自然》杂志上的一项研究,为我们带来了一种可能的解决方案——线性对称自选14位动能分子忆阻器。 忆阻器,作为一种新型的非易失性存储器件,因其在模拟计算和神经形态计算中的潜在应用而备受关注。然而,现有的忆阻器...

文章 2024-02-23 来自:开发者社区

mnn-llm: 大语言模型端侧CPU推理优化

在大语言模型(LLM)端侧部署上,基于 MNN 实现的 mnn-llm 项目已经展现出业界领先的性能,特别是在 ARM 架构的 CPU 上。目前利用 mnn-llm 的推理能力,qwen-1.8b在mnn-llm的驱动下能够在移动端达到端侧实时会话的能力,能够在较低内存(<2G)的情况下,做到快速响应。 ...

mnn-llm: 大语言模型端侧CPU推理优化

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"productCardStyle","productCode":"aliyun","productCardInfo":{"productTitle":"文档智能&RAG,让你的AI大模型开启“外挂”之旅","productDescription":"本方案介绍了如何实现将文档智能和检索增强生成(RAG)结合起来构建强大的LLM知识库,包括清洗文档内容、文档内容向量化、问答内容召回后通过特定的Prompt,提供给LLM足够的上下文信息,以此来满足对于企业级文档类型知识库的问答处理。","productContentLink":"https://www.aliyun.com/solution/tech-solution/document-mind-rag-for-llm","isDisplayProductIcon":true,"productButton1":{"productButtonText":"方案详情","productButtonLink":"https://www.aliyun.com/solution/tech-solution/document-mind-rag-for-llm"},"productButton2":{"productButtonText":"一键部署","productButtonLink":"https://help.aliyun.com/document_detail/2845368.html"},"productButton3":{"productButtonText":"查看更多技术解决方案","productButtonLink":"https://www.aliyun.com/solution/tech-solution/"},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"解决方案推荐","productPromotionInfoFirstText":"10分钟在网站上增加一个 AI 助手","productPromotionInfoFirstLink":"https://www.aliyun.com/solution/tech-solution/add-an-ai-assistant-to-your-website-in-10-minutes","productPromotionInfoSecondText":"10 分钟构建 AI 客服并应用到网站、钉钉或微信中","productPromotionInfoSecondLink":"https://www.aliyun.com/solution/tech-solution/build-a-chatbot-for-your-website-or-chat-system"}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock"}}