数据湖

  1. 阿里云 >
  2. 全部产品 >
  3. 对象存储 OSS >
  4. 数据湖

应用场景

数据湖
数据湖
能够提供
海量弹性
计算存储分离,存储规模弹性扩容
生态开放
对Hadoop生态友好,且无缝对接阿里云各计算平台
高性价比
统一存储池,避免重复拷贝,多种类型冷热分层
更易管理
加密、授权、生命周期、跨区复制等统一管理
推荐搭配使用
点击查看完整内容
数据湖 相关文章
数据湖构建
阿里云数据湖构建(Data Lake Formation,DLF)是一款全托管的快速帮助用户构建云上数据湖的服务,产品提供了云上数据湖统一的权限管理、数据湖元数据管理和元数据自动抽取能力。
数据湖元数据
EMR-3.30.0及之后版本和EMR-4.5.0及之后版本,默认选择数据湖元数据作为Hive数据库。数据湖元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,例如同时使用MaxCompute和E-MapReduce(简称...
数据湖Iceberg结果表
本文为您介绍数据湖Iceberg结果表的DDL定义、WITH参数、类型映射和代码示例。什么是数据湖Iceberg Apache Iceberg是一种开放的数据湖表格格式。您可以借助Apache Iceberg快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并借助开源大...
云原生数据湖分析 DLA
云原生数据湖分析(Data Lake Analytics,简称DLA)是无服务器(Serverless)化的数据湖分析服务,支持按需与保留资源使用,打造最具性价比的数据湖分析平台;提供一站式的数据湖分析与计算服务,支持 ETL、机器学习、流、交互式分析,可以...
数据湖元数据管理
2.12及之后版本,在创建集群选择元数据类型时支持数据湖元数据作为Hive数据库。数据湖元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,例如同时使用Databricks 数据洞察和E-MapReduce。...
全量数据湖Iceberg源表
本文为您介绍全量数据湖Iceberg源表的DDL定义、WITH参数、类型映射和代码示例。什么是数据湖Iceberg Apache Iceberg是一种开放的数据湖表格格式。您可以借助Apache Iceberg快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并借助开源...
数据湖管理FAQ
围绕OSS对象存储等数据湖存储,构建上层可扩展的数据入湖能力,把Hudi、Delta等高效的对象管理格式和Parquet、ORC等对象格式,写入到数据湖中,并在写入过程中支持UPSERT、小文件合并、MVCC多版本、快照读等能力,用仓的特性来解决单纯...
EMR+DLF数据湖解决方案
在EMR+DLF数据湖方案中,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本文为您介绍EMR+DLF数据湖方案具体步骤。背景信息在EMR数据湖方案中,结合DLF,可以为企业提供数据湖内的...
Superset连接数据湖分析
本文主要介绍如何使用Superset连接DLA进行数据分析。背景信息 DLA对外暴露的是MySQL的协议,大多数BI工具可以使用MySQL连接器直接连接DLA,由于Superset对于表的定义语句校验严格,同时DLA的建表语句与MySQL的建表语句存在差别,这导致...
数据湖构建之MaxCompute湖仓一体最佳实践
与数据湖(OSS、EMR、DDI、HOLO等)联动,无需数据搬迁即可无缝处理和分析数据湖数据仓一体方案的整体架构如下图所示:整个方案以OSS存储为基础、通过配套使用数据湖构建DLF(Data Lake Formation)产品,MaxCompute、其他湖上引擎与...

热门推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
其他推荐内容