应用实践 | 数仓体系效率全面提升!同程数科基于 Apache Doris 的数据仓库建设
导读:同程数科成立于 2015 年,是同程集团旗下的旅游产业金融服务平台。2020 年,同程数科基于 Apache Doris 丰富的数据接入方式、优异的并行运算能力、极简运维等特性,引入 Apache Doris 进行数仓架构2.0 的搭建。本文详细讲述了架构1.0 到 2.0 的演进过程及 Doris 的应用实践,希望对大家有所帮助。作者|同程数科大数据高级工程师 王星业务背景业务介绍同程数....
【大数据基础实践】(六)数据仓库Hive的基本操作
目录1. 数据仓库概念2. Hive简介2.1 简介2.2 特性2.3 生态系统3. Hive系统架构4. HQL转成MapReduce作业的原理4.1 join的实现原理4.2 group by的实现原理5. 实验练习5.1 环境配置5.1.1 HIVE5.1.2 MYSQL5.1.3 配置MySql为hive元数据存储数据库5.2 Shell进行实验内容5.2.1 新建一个数据库;5.2.2....
MaxCompute大数据实践,电商数据仓库选择雪花还是星型模型?
作者:王永伟 规范化和反规范化 当属性层次被实例化为一系列维度,而不是单一的维度时,此模式被称为雪花模式。大多数联机事务处理系统(OLTP)的底层数据结构在设计时采用此种规范化技术,通过规范化处理将重复属性移至其自身所属的表中,删除冗余数据。 此种方法用在OLTP系统中可以有效避免数据冗余导致的不一致性。比如在OLTP系统中,存在商品表和类目表,且商品表中冗余有类目表的属性字段,假设对某类....
MaxCompute大数据实践,电商数据仓库的星型模型和传统星型的区别
作者:王永伟 在Kimball所著的《数据仓库工具箱》一书中,对于维度模型设计采用的4步设计方法:1.选择业务过程 2.声明粒度 3.确定维度 4.确定事实。 在当前的互联网大数据环境下,面对复杂的业务场景,为了更有效准确地进行维度模型建设,基于Kimball的4步维度建模方法,我们进行了更进一步的改进。 第一步:选择业务过程及确定事实表类型 在明确了业务需求以后,接下来需要进行详细的需求.....
数据中台建设方法论实践之数据仓库建设
当前,“新基建”正在成为朝野共识,是应对疫情和经济下行的最简单有效手段,是中美贸易摩擦下大国竞争和改革创新的胜负手,不是“四万亿重来”“重走老路”。本次新基建的内容包含:加快 5G 商用步伐,加强人工智能、工业互联网、大数据中心、物联网等新型基础设施建设,加大城际交通、物流、市政基础设施等投资力度,补齐农村基础设施和公共服务设施建设短板,加强自然灾害防治能力建设。在此背景下云计算、大数据、人工智....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
实时数仓 Hologres
本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等,也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975
+关注