最佳实践
搭建 DeepSeek RAG 解决方案
2025.02.20
阿里云向量检索服务Milvus版是一款云原生、全托管的向量检索引擎,确保与开源Milvus的完全兼容,支持自建集群无缝迁移上云。在开源版版本的基础上增强了稳定性、可用性与可扩展性,能提供超大规模向量数据的相似性检索服务。 查看详情
拥抱开源
持续拥抱开源Milvus和AI生态
坚持100%兼容开源生态,在AI、搜索推荐等领域内,坚持与开源社区一起共建产品能力。向客户提供兼容程度高,迁移成本低,灵活可控的全托管向量检索服务。
高易用
为用户提供易用的云上产品体验
提供全套的监控告警体系,为用户免去繁琐自运维步骤,同时针对用户具体使用场景,支持升降配、高弹性的能力。
低成本
阿里云提供强大的技术能力,大幅降低成本
阿里云Milvus提供读写分离、存算分离技术实现精细化的存储计算资源管理技术,结合阿里云提供的全套运维服务,实现至少30%成本下降。
企业级全托管的可扩展 AI 向量检索引擎
阿里云向量检索服务 Milvus 版基于 Serverless 的架构打造产品能力,提供快速的水平和垂直集群扩展能力。致力于为客户提供优质的产品体验,基于阿里云 Milvus 运管平台能力,我们提供 99.9% 的可用性保证。
云原生极速向量检索服务
阿里云向量检索服务Milvus版集成了丰富的Vector检索库,凭借其高性能、高可用性的特点,支持混合查询、聚合检索、多向量查询等高阶能力,为用户提供高效且稳定的向量数据检索能力。
开源及阿里云AI生态集成
无缝兼容LangChain、LlamaIndex等框架,并与阿里云人工智能平台 PAI-EAS,通义等 AI 产品矩阵集成,为企业的 AI 应用场景落地,提供更快捷易用的产品体验。
01开通阿里云Milvus服务
打开阿里云Milvus开通页面
通过资源计算器大致评估所需的计算资源规模
02完成权限授权并导入数据
完成权限授权以及网络安全配置
通过SDK或Attu数据可视化组件导入数据
03进行向量检索
使用阿里云Milvus进行向量检索
检查Milvus实例监控、报警功能,并体验更多功能
结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。
相关产品
结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。
相关产品
向量检索服务Milvus版目前采用混合计费的付费模式,分为:计算资源包年包月计费+存储资源按量计费。
以下为向量检索服务Milvus版提供的计费方式。
阿里云向量检索服务Milvus版是一款向量检索引擎,用于存储和检索大规模向量数据,源于开源,但不止于开源。它完全兼容开源Milvus API,可以从访问控制、网络、存储、操作审计等方面,提供全面的安全加固功能来保障您的数据安全。
数据安全
系统数据安全:管控服务通过HTTPS化确保了请求访问链路的安全,同时对产品服务数据实施多备份存储策略,以增强数据传输和存储的安全性。通过这些措施,管控服务不仅确保了数据在传输过程中的安全,还通过多备份策略保障了数据的持久性和可靠性,为用户提供了一个全面、可靠的安全保障体系。
业务数据安全:阿里云向量检索服务Milvus版专注于提供高效的向量检索能力,本身并不负责存储用户的业务数据,具体业务数据安全交由阿里云对象存储OSS保证,该系统提供同城多副本冗余机制,保障业务数据正常访问。
鉴权认证
账号认证:管控服务接口与阿里云账号体系的集成,并且Milvus遵循基于角色的访问控制(RBAC)认证机制,共同构成一个多层次的安全框架确保了用户访问的安全性,同时也为管理员提供了灵活而强大的权限管理工具,以适应不同的业务场景和安全需求。
白名单:Milvus服务默认只能通过指定安全组下的ECS实例进行内网访问,降低了数据泄露的风险。除了内网访问,Milvus还支持通过设置公网IP白名单的方式允许特定的外部IP地址访问服务,用户可以根据自己的需求将信任的IP地址添加到白名单中,实现公网访问。
安全审计:通过集成管控服务接口与阿里云审计服务,用户现在可以轻松地进行管控操作日志审计,这一过程变得更加高效和便捷。
安全隔离
网络隔离:使用全托管容器在阿里云内网中部署,并通过代理组件与用户私网连接,通过这种部署方式,用户可以避免公网访问服务带来的潜在安全风险,同时享受到阿里云提供的安全、可靠且易于管理的服务,同时确保业务数据和操作的安全性。
底层资源隔离:底层采用容器化技术实现资源隔离,为不同集群提供了独立的计算环境。通过这种资源隔离策略,不同集群可以高效、安全地共享底层基础设施,同时保持相互独立,互不干扰,为各种应用和服务提供了一个稳定、可靠、可扩展的运行环境。