Delta Lake基础介绍(开源版)【Databricks 数据洞察公开课】

Delta Lake基础介绍(开源版)【Databricks 数据洞察公开课】

作者:王晓龙(筱龙),阿里云开源大数据平台技术专家一、Delta Lake背景回顾1. 大数据平台架构演进大数据平台经历了三种架构的演进:a.第一代:数仓架构支持的场景有限,不适用于高阶复杂的查询分析场景,比如data science和ML场景;scale-out扩展能力差。b.第二代:数据湖+数仓...

Delta Lake的演进历史及现状【Databricks 数据洞察公开课】

Delta Lake的演进历史及现状【Databricks 数据洞察公开课】

作者:王晓龙 阿里云开源大数据平台技术专家一、Delta Lake介绍大数据平台架构发展至今,已经经历了三个阶段的技术演进:从最早的数仓,到数据湖+数仓的架构,再到最近两年的Lakehouse架构。最早的数仓架构是Schema-on-write的设计。如上图,数据首先由关系型数据库经过ETL导入数据...

Databricks数据洞察公开课

5 课时 |
54 人已学 |
免费
开发者课程背景图
Delta Lake基础介绍(商业版)【Databricks 数据洞察公开课】

Delta Lake基础介绍(商业版)【Databricks 数据洞察公开课】

作者:李洁杏,Databrick资深软件工程师一、Lakehouse搜索引擎设计背景1. 数据仓库和Lakehouse数据管理系统从早期的数据仓库(Data Warehouse),已经发展到今天的Lakehouse。Lakehouse可以同时存储结构化、半结构化和非结构化数据,并且支持流分析、BI、...

如何使用Delta Lake构建批流一体数据仓库【Databricks 数据洞察公开课】

如何使用Delta Lake构建批流一体数据仓库【Databricks 数据洞察公开课】

作者:李元健,Deltabricks软件工程师冯加亮,阿里云开源大数据平台技术工程师Delta Lake是一个开源存储层,它为数据湖带来了可靠性。Delta Lake提供了ACID事务、可扩展的元数据处理,并统一了流式处理和批处理数据处理。Delta-Lake运行在现有数据湖之上,并且与Apache...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
Databricks数据洞察:从入门到实践
立即下载