向量 Bucket

支撑万亿规模向量存储,成本降低 95%,助力 AI Agent 规模化落地。

产品介绍

向量 Bucket 是 OSS 提供的一种专门用于存储、查询和管理向量数据的 Bucket 类型:

具有低成本、大规模和简单易用的特点,
面向多模态检索、知识库、RAG、AI Agent 等 AI 场景提供向量存储和向量查询的能力。

成本降低 95%
Serverless 架构
万亿规模向量存储

向量 Bucket 是 OSS 提供的一种专门用于存储、查询和管理向量数据的 Bucket 类型:

具有低成本、大规模和简单易用的特点,
面向多模态检索、知识库、RAG、AI Agent 等 AI 场景提供向量存储和向量查询的能力。

成本降低 95%
Serverless 架构
万亿规模向量存储
核心优势

大规模

Serverless 的弹性扩缩容架构,无需关心集群扩容问题,轻松承载海量向量数据的存储需求

低成本

 仅按存储容量和检索扫描量计费,简洁友好,使用成本较传统方式大幅下降 95% 以上

简单易用

提供完整的 API、SDK 和命令行工具,支持在 OSS 控制台进行管控和向量数据读写操作

统一管理

使用不同类型 Bucket 存储原始和向量数据,统一管理权限,配置相同日志导出路径操作审计

开放兼容

支持任意向量模型产生的向量数据写入,也可使用 OSS 命令行工具将阿里云百炼的向量数据快速写入

场景应用
电商商品相似度检索
数据存储至 OSS,阿里云百炼生成相似品、关联品向量数据,同标签信息写入向量 Bucket,用语义检索查找相关商品,并通过分表读写管理,实现数据安全与统一管控。
icon

AI 训练数据集的语义检索
简化加速 AI 数据集查找与数据预处理,支持将 AI 数据集的标签等描述信息随向量写入,实现检索结果标量过滤,同时有效降低了超大规模数据的存储成本。
icon

海量多租户知识库
单地域创建数万级向量 Index,实现海量租户间的内容隔离,让每位终端用户精准检索专属知识库内容,凭借 Serverless 化形态,以极低起建成本快速支撑全球化业务部署。
icon

AI 助手多模态语义检索
原始数据和向量数据集中存储在 OSS,并通过相同语义的 Bucket Policy 对原始数据和向量数据进行统一管理,使用简单,无需运维,能够支撑应用快速构建和上线。
icon

最佳实践

OSS Vectors Embed CLI 工具写入和检索向量数据

将文件向量化并写入向量 Bucket,支持多模态检案,简化应用开发流程

快速构建多模态图片语义检索

基于向量 Bucket 和阿里云百炼向量模型快速构建,实现自然语言描述的文搜图

基于多索引表架构的大规模向量检索

通过多索引架构,按租户或业务维度拆分数据,兼顾隔离性和检索性能

构建向量与原始文件的映射关系

根据检索结果返回的向量 Key 和元数据返回关联的原始文件

并发执行向量语义检索

并发执行多条检索请求,在降低检索总耗时的基础上显著提升检索结果数量

客户案例
bannerbanner
01
某在线教育公司构建拍照搜题平台
该公司拥有上百万题库图片,基于固定标签的传统检索在效果、效率上难以满足需求,借助阿里云百炼对题库图片和文字进行向量化,并将向量结果与相关标量元数据信息一同写入向量 Bucket,通过其语义检索接口提供以图搜图能力,大幅提升了题目检索的精准度。
海量题库的多模态检索
02
某游戏公司构建 AIGC 资产检索和管理平台
该企业积累了大量图片、视频等 AIGC 游戏素材,通过阿里云百炼对素材向量化,将业务标签(如权限归属、分类信息、AIGC 标识等)随向量数据一同写入 OSS 向量 Bucket,构建 AIGC 素材资产的检索和管理平台,支持企业高效检索并统一管理海量素材。
数据检索与管理