阿里云AirCache技术实现多模态大模型高效推理加速,入选国际顶会ICCV2025
近日,计算机视觉国际大会ICCV2025公布论文评选结果,阿里云自主研发的最新技术成果《AirCache: Activating Inter-modal Relevancy KV Cache Compression for Efficient Vision-Language Model Inference》被大会录用。该研究聚焦视觉语言模型(VLMs)的高效推理难题,提出了一种新颖的AirCac....

Gemma 3n正式版开源:谷歌全新端侧多模态大模型,2GB 内存就能跑,重点提升编码和推理能力!
01.引言 6月底,Google正式开源发布了全新端侧多模态大模型 Gemma 3n!相较此前的预览版,最新的 Gemma 3n 完整版进一步提升性能表现,支持在 2GB 内存的硬件上本地运行,重点提升了编码和推理方面的能力。 Gemma是来自Google的一系列轻量级、最先进的开放模型, 它们基于创建Gemini模型所用的相同研究和技术构建。 Gemma 3n模型专为在资源有限...

从“看图说话”到“脑补世界”:多模态大模型的进化之路
还记得只会“看图说话”的AI吗?如今,新一代多模态大模型(Multimodal LLMs)正突破单一信息类型的限制,学习同时理解文本、图像、音频甚至视频,向更接近人类感知世界的方式迈进。 其核心突破在于统一表示学习。模型不再将图像像素、文字单词视为截然不同的数据,而是通过强大的编码器(...
小米又放大招!MiMo-VL 多模态大模型开源,魔搭推理微调全面解读来了!
01.引言 今天,小米开源发布两款 7B 规模视觉-语言模型 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL。 MiMo-VL-7B的模型架构为: ① 保持细粒度视觉细节的原生分辨率ViT编码器 ② 用于高效跨模态对齐的MLP projector ③ 专为复杂推理任务优化的MiMo-7B语言模型 ...

阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step!
前言 阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step! 摘要:音乐创作全能“编辑器”:高效多元、强可控、可编辑,满足多样化需求。 一年前,阶跃与 ACE Studio 达成深度战略合作,依托 ACE Studio 的专业级音乐能力与阶跃领先的多模态技术,双方致力于打造最懂音乐的大模型,为广泛的音乐爱好者提供科技化的音乐表达工具。一年...

DB-GPT V0.7.1 版本更新:支持多模态模型、支持 Qwen3 系列,GLM4 系列模型 、支持Oracle数据库等
V0.7.1版本主要新增、增强了以下核心特性 DB-GPT支持多模态模型。 DB-GPT支持 Qwen3 系列,GLM4 系列模型。 MCP支持 SSE 权限认证和 SSL/TLS 安全通信。 支持Oracle数据库。 支持 InfiniAI 代理模型。 ReAct Agent 优化:支持处理更复杂的任务。 ✨新特性 ...

通过阿里云Milvus与通义千问实现多模态搜索
本文通过代码示例展示了如何结合阿里云向量检索服务Milvus与通义千问VL大模型,以提取图片特征,并利用多模态Embedding模型实现高效的多模态搜索,涵盖了以文搜图、以文搜文、以图搜图以及以图搜文等多种检索方式。
多模态模型卷王诞生!InternVL3:上海AI Lab开源78B多模态大模型,支持图文视频全解析!
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 「多模态模型卷王诞生!上海AI Lab开源78B参数巨...

结合多模态RAG和异步调用实现大模型内容
1.项目背景和方案架构 1.1 项目背景 理赔业务是物流行业经常需要处理的问题,客服需要审核客户上传的受损货物的图片资料,对受损情况做判定,然后给客户提供赔偿金额;整体的流程需要人工操作,效率很低,因此如何用大模型作为切入点为理赔业务提效成为重点关注问题。理赔工作存在一个风险点,客户如果上传虚假的理赔图片,会造成物流公司的业务损失,比如客户上传的图片是曾经上传...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
通义大模型
阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi
+关注