云原生企业级数据湖
为什么选择云原生企业级数据湖
一份存储、多种引擎
各种类型的数据以集中方式统一存储在对象存储 OSS,解决数据孤岛,避免数据分散在多种不同的系统,极大降低运维管理难度。
数据无需处理、直接存储
支持结构化、半结构化、非结构化等多种类型数据,数据可以按照原始产生的形态直接存储到数据湖,提供便捷的数据接入和数据消费通道。
计算与存储解耦合
提供更灵活的系统架构设计,通过细粒度的权限控制、数据加密和日志记录与审计等机制保障数据安全。
云原生企业级数据湖
对象存储 OSS 作为数据湖统一存储,可以存储来自于不同数据源的各类型数据。 通过多种存储类型实现数据冷热分层,可无缝对接 EMR、PAI 等大数据分析和训练引擎。

结合高性能文件存储 CPFS,实现 OSS 与 CPFS 数据双向流通,同时,热点训练数据以透明方式同步到 CPFS,通过 CPFS 的文件语义与机器学习平台 PAI 对接,满足高性能训练场景需求。
部署时长:80 分钟
预估费用:5 元(假设您选择最低规格资源,且资源运行时间不超过 30 分钟。如调整了资源规格,请以控制台显示的实际报价以及最终账单为准)
技术方案的广泛应用场景

基于开源生态构建大数据分析
支撑 Hadoop 开源生态构建大数据分析方案,解决了传统 Hadoop 在扩展性、运维模式、成本优化方面的难题。

海量数据冷热分层
大数据场景中有大量数据累积,并且数据随着时间推移访问热度会大幅降低。解决了数据分散在各个集群,优化长期存储成本。

基于数据湖的人工智能
数据湖支持 AI 的关键流程,包括数据存储、预处理、特征提取、模型训练和部署,利用机器学习平台的技术优势,提高训练速度。
阿里云为您提供云产品免费试用
该文章对您有帮助吗?