• 便捷运维

    提供智能湖表优化、智能存储分层、存储指标可观测、快照版本回溯等能力,提升50% Paimon表维护效率
  • 高性价比

    降低30%存储成本, 流、批、OLAP查询性能全面提升,最高提升2倍查询性能
  • 安全管控

    所有引擎共享一套湖表权限配置,实现一次配置,多处生效,支持Catalog、库、表、字段粒度权限管理
  • 兼容开源

    100%兼容开源并提供增值能力,深度整合阿里云流/批/OLAP/搜索/AI等产品,具备完善的云生态支持体系
  • 1/0

    产品简介

    阿里云数据湖构建(Data Lake Formation,简称DLF)是一款全托管的统一元数据和数据存储及管理平台,为客户提供元数据管理、权限管理、存储管理、存储优化、版本管理、冷热分层等功能。基于Lakehouse湖仓一体架构,以Paimon为核心Lakehouse Format,兼容Iceberg,构建统一多模态湖表存储服务,支持结构化、半结构化、非结构化等多模态数据存储、管理、优化,通过智能算法和存储结构优化大幅提升数据读写及存储效率。该平台平权支持阿里云流、批、分析、AI等多种大数据&AI产品,实现元数据的统一、湖表格式的统一、数据存储的统一、数据权限的统一,显著简化客户在Lakehouse构建和管理过程中的运维工作,助力企业聚焦于业务创新和数据洞察。
    数据湖构建 Data Lake Formation

    产品优势

    DLF 基于 Lakehouse 湖仓一体架构,以 Paimon 为核心 Lakehouse Format,兼容 Iceberg,构建统一多模态湖表存储服务,支持结构化、半结构化、非结构化等多模态数据存储、管理、优化。

    高性价比的湖仓存储

    智能且按量付费的湖表优化、智能存储分层、存储指标可观测、快照版本回溯等能力,整体降低30%存储成本,提升50% Paimon表维护效率,提高引擎+存储端到端整体2倍查询性能。

    全托管湖表管理和运维服务

    Paimon元数据与存储服务统一管理和运维,实现统一开放、开箱即用的全托管湖表服务,兼容各种开源文件格式,便捷地构建面向AI时代的大数据AI一体化融合基础设施。

    企业级安全与数据共享

    提供API权限和数据权限的双重访问控制,支持Catalog、库、表、字段级的细粒度权限控制,支持多AZ数据容灾,支持跨账号的数据共享,确保数据安全合规与稳定。

    兼容开源并具备更强大的生态

    Paimon商业化增值平台,兼容开源并超越开源,与阿里云大数据+搜索+AI多引擎融合,构建强大的生态系统。并实现引擎平权,各引擎元数据、存储、权限统一管理。

    图片

    国内首批!得分排名第一!

    DLF与阿里云E-MapReduce、OSS 以及 DataWorks一起组成的云原生数据湖解决方案,通过了工业和信息化部中国信息通信研究院大数据能力专项评测,荣获“云原生数据湖基础能力专项评测证书”。阿里云及国内友商等都参与标准设计,最终阿里云以得分排名第一的标准考核荣获云原生数据湖专项评测证书。
    DLF与阿里云E-MapReduce、OSS 以及 DataWorks一起组成的云原生数据湖解决方案,通过了工业和信息化部中国信息通信研究院大数据能力专项评测,荣获“云原生数据湖基础能力专项评测证书”。阿里云及国内友商等都参与标准设计,最终阿里云以得分排名第一的标准考核荣获云原生数据湖专项评测证书。

    安全合规

    DLF在稳定可靠的基础上,提供了多维度的访问控制能力以及多种数据加密方式,并具备审计与合规能力,满足企业数据安全与合规要求。

    卡片头部图

    容灾安全

    数据容灾数据支持多副本存储,任一数据出现问题时,副本数据自动切换恢复,保证数据的可靠性。
    全球化部署在全球多个Region提供部署服务
    卡片头部图

    基础设施安全

    存储传输加密通过数据盘加密,对动态数据传输及静态数据加密,保护数据的隐私性和自主性,为业务数据提供安全边界。
    数据共享安全处理后的数据可以作为共享资源,实现各个团队的按需访问,同时确保数据的安全性
    卡片头部图

    系统安全

    权限管控使用阿里云通用RAM账号体系,控制对Catalog、库、表、字段的访问权限。
    操作审计通过系统表记录用户操作日志,满足业务实时审计、问题回溯分析需求。