文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(7)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(6) https://developer.aliyun.com/article/1231079?groupCode=tech_library3) 事实表设计a) 事务型事实表• 针对业务过程构建的一类事实表,用以跟踪定义业务过程的个体行为,是数仓最原子的明细数据,提供丰富的分析能力。• 按照所描述的业务过程的数量分为单事务事实表和多事务事....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(7)
文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(8)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(7) https://developer.aliyun.com/article/1231078?groupCode=tech_libraryc) 多事务事实表淘宝多事务事实表:dwd_tb_trd_ord_ent_di基本特征 业务过程:订单创建→支付→完结 事实表类型:多事务事实表 粒度:子订单ID 度量:订单创建金额、支付金额等 冗余....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(8)
问答 2023-01-11 来自:开发者社区

DataWork智能数仓建设中多BU 公共层是否需要统一规范?怎么去做?怎么量化价值?

DataWork智能数仓建设中多BU 公共层是否需要统一规范?怎么去做?怎么量化价值?

问答 2023-01-11 来自:开发者社区

模型是怎么打分的?怎么控制数仓SQL规范?

模型是怎么打分的?怎么控制数仓SQL规范?

文章 2022-12-29 来自:开发者社区

数仓建模理论与规范(三)| 学习笔记

开发者学堂课程【智能数据建模训课程 :数仓建模理论与规范(三)】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/1223/detail/18308数仓建模理论与规范六、数据模型设计的流程1、流程数据模型设计一般会分阶段。首先是需求调研阶段,该阶段更多的是在于之前提到的业务方法;第二阶段是规范定义,对....

数仓建模理论与规范(三)| 学习笔记
文章 2022-12-29 来自:开发者社区

数仓建模理论与规范(二)| 学习笔记

开发者学堂课程【智能数据建模训课程 :数仓建模理论与规范(二)】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/1223/detail/18308数仓建模理论与规范四、数据分层架构设计关于数据分层,目前占大多数的比较传统的经典的三层模型架构设计以及台内外的分层设计方式都是按照从 ODS 贴原,中间系....

数仓建模理论与规范(二)| 学习笔记
文章 2022-12-29 来自:开发者社区

数仓建模理论与规范(一)| 学习笔记

开发者学堂课程【智能数据建模训课程 :数仓建模理论与规范(一)】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/1223/detail/18308数仓建模理论与规范 内容介绍:一、数仓模型简介二、数仓模型架构设计目标三、数仓模型架构设计核心思想四、数据分层架构设计五、数据分域架构设计六、数....

数仓建模理论与规范(一)| 学习笔记
文章 2022-05-13 来自:开发者社区

数据仓库心得(7)数仓规范设计

规范设计在这里取《大数据之路:阿里巴巴大数据实践》中的定义,这里记录一下本人对这一块自己的理解。规范定义指以维度建模作为理论基础 构建总线矩阵,划分和定义数据域、业务过程、维度、度量 原子指标、修饰类型、修饰词、时间周期、派生指标。所谓的规范的定义,简单理解,如果把数据当作货物,那就是货物的分类,以及对应相关的属性,比如生产日期,某个原料的含量等,我们可以把相近或者相同货物,按照一定的规律,放在....

文章 2022-04-27 来自:开发者社区

最强最全面的数仓建设规范指南 (三)

4) 累积快照事实表多个业务过程联合分析而构建的事实表,如采购单的流转环节。用于分析事件时间和时间之间的间隔周期。少量的且当前事务型不支持的,如关闭、发货等相关的统计。4. DWS公共汇总层设计规范数据仓库的性能是数据仓库建设是否成功的重要标准之一。聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据,可以减少数据库在响应查询时必须执行的工作量,能够快速响应用户的查询,同时有....

最强最全面的数仓建设规范指南 (三)
文章 2022-04-27 来自:开发者社区

最强最全面的数仓建设规范指南 (二)

1) 指标梳理指标口径的不一致使得数据使用的成本极高,经常出现口径打架、反复核对数据的问题。在数据治理中,我们将需求梳理到的所有指标进行进一步梳理,明确其口径,如果存在两个指标名称相同,但口径不一致,先判断是否是进行合并,如需要同时存在,那么在命名上必须能够区分开。2) 指标管理指标管理分为原子指标维护和派生指标维护。原子指标:选择原子指标的归属产线、业务板块、数据域、业务过程选择原子指标的统计....

最强最全面的数仓建设规范指南 (二)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云原生数据仓库AnalyticDB

定期发送云原生数据仓库AnalyticDB产品重大发布和技术干货

+关注