离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

数仓规划概述

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

数仓规划概述

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

概念建模概述

背景信息 在建设数据台的流程,一般的首要任务是对整个业务进行前置调研,如先盘点出参与业务的人员、事物和基本规则定义,并理清人、事、物之间的关系和发生的各种交互行为。在全面了解业务的架构和运行情况后,产出业务的概念模型。...

概念建模概述

背景信息 在建设数据台的流程,一般的首要任务是对整个业务进行前置调研,如先盘点出参与业务的人员、事物和基本规则定义,并理清人、事、物之间的关系和发生的各种交互行为。在全面了解业务的架构和运行情况后,产出业务的概念模型。...

逻辑结构说明

项目 项目是一种物理空间上的划分,便于用户在数据建设过程对物理资源及开发人员进行隔离化管理。业务对象 人们观察事物的角度,是指一种视角,是确定事物的多方位、多角度、多层次的条件和概念。业务活动 业务过程即企业的业务活动...

添加识别特征

则(大小兼容):在输入框输入则表达式。例如您需要匹配所有名称带有test,则则表达式定义为.*test.*。则表达式:在输入框输入则表达式。例如您需要匹配所有名称带有test,则则表达式定义为.*test.*。识别阈值:只有...

添加识别特征

则(大小兼容):在输入框输入则表达式。例如您需要匹配所有名称带有test,则则表达式定义为.*test.*。则表达式:在输入框输入则表达式。例如您需要匹配所有名称带有test,则则表达式定义为.*test.*。识别阈值:只有...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin,已接入的数据源可用于读取原始数据和写入数据建设过程的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin,已接入的数据源可用于读取原始数据和写入数据建设过程的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

步骤二:规划数仓

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

步骤二:规划数仓

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据台。Dataphin兼容多种计算...

核心概念

本文为您介绍Dataphin,业务板块、数据域、项目、维度、业务过程、维度逻辑表、事实逻辑表、原子指标等基本概念。数据板块 数据板块是逻辑空间的重要组成部分,是基于业务特征划分的命名空间。当数据的业务含义存在较大差异时,您可以...

元数据仓库共享模型概述

业务租户:统称为 开发租户,进行数据建设的租户,即进行数据开发和治理的核心使用租户。一个Dataphin实例可以创建多个开发租户,由元仓租户在租户设置页面创建并分配可用资源(数据处理单元数、质量规则数等)。元仓共享模型数据说明 ...

Dataphin智能数据建设与治理试用服务协议

协议版本生效日期:2022年11月22日 本协议是 Dataphin智能数据建设与治理(简称“Dataphin”)与您就 Dataphin 提供的免费试用服务的相关事项所订立的有效合约。1.免费试用内容说明 1.1 免费试用次数:每个 UID 仅可开通 1 次免费试用。1.2...

Dataphin智能数据建设与治理服务等级协议(半托管)

版本生效日期:2024年03月26日 本服务等级协议(Service Level Agreement,以下简称“SLA”)约定了阿里云向客户提供的智能数据建设与治理(简称“Dataphin”)的服务可用性等级指标及赔偿方案。特别提示您,除非另有约定,本协议不适用于...

数仓构建流程

本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。操作步骤 在Dataphin页面,按照以下操作指引或单击蓝色小机器人选择 答疑支持,进入答疑支持页面后,输入您需解答的问题。依次单击 ...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。使用说明 需保证网络连通、Dataphin已升级至3.14.1及以上版本且已经对接工单系统(如需对接可联系运维部署团队)方可使用工单功能。...

管理动态脱敏白名单

选中 自定义 后,请输入则表达式匹配业务板块,例如:您需要匹配所有名称带有test的业务板块,则则表达式定义为.*test.*。表项目:选择数据表的项目。选中 全部,即选中所有的项目。选中 枚举 后,需配置项目,支持多选。选中 自定义...

管理动态脱敏白名单

选中 自定义 后,请输入则表达式匹配业务板块,例如:您需要匹配所有名称带有test的业务板块,则则表达式定义为.*test.*。表项目:选择数据表的项目。选中 全部,即选中所有的项目。选中 枚举 后,需配置项目,支持多选。选中 自定义...

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin,项目可以归属至数据板块以实现规范建模功能,同一个数据板块可能包含多个不同的项目...

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin,项目可以归属至数据板块以实现规范建模功能,同一个数据板块可能包含多个不同的项目...

资产安全概述

资产安全为Dataphin提供了数据生命周期统一的敏感数据识别与保护能力。通过数据分类分级、敏感数据识别、敏感数据脱敏等措施,帮助客户建立完善的数据安全体系,确保数据使用的安全合规性。前提条件 已购买 资产安全 增值服务并且当前...

资产安全概述

资产安全为Dataphin提供了数据生命周期统一的敏感数据识别与保护能力。通过数据分类分级、敏感数据识别、敏感数据脱敏等措施,帮助客户建立完善的数据安全体系,确保数据使用的安全合规性。前提条件 已购买 资产安全 增值服务,详情请...

确定需求

在基于Dataphin构建与管理企业数据台之前,首先需要确定数仓构建的目标与需求,进行全面的业务调研。您需要了解真实的业务需求是什么,以及确定整个业务系统能解决什么问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,...

设置Dataphin实例的计算引擎

校验成功后,单击 确认并开始数据建设,即可开始数据建设。后续步骤 完成设置Dataphin实例的计算引擎后,您就可以准备后续数据研发过程用于读取和写入数据的数据源、用于提供计算资源的计算源。具体操作,请参见 准备数据源和计算源。

配置TiDB输入组件

同步TiDB数据源的数据至其他数据源的场景,您需要先配置TiDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置TiDB输入组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输入组件属性...

配置MySQL输入组件

同步MySQL数据源的数据至其他数据源的场景,您需要先配置MySQL输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置MySQL输入组件。操作步骤 请参见 离线管道组件开发入口,进入离线管道脚本的开发页面。按照下图...

配置MySQL输入组件

同步MySQL数据源的数据至其他数据源的场景,您需要先配置MySQL输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置MySQL输入组件。操作步骤 请参见 离线管道组件开发入口,进入离线管道脚本的开发页面。按照下图...

配置TiDB输入组件

同步TiDB数据源的数据至其他数据源的场景,您需要先配置TiDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置TiDB输入组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输入组件属性...

配置GBase 8a输入组件

同步GBase 8a数据源的数据至其他数据源的场景,您需要先配置GBase 8a输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置GBase 8a输入组件。前提条件 已创建GBase 8a数据源,如何创建,请参见 创建GBase 8a数据源。...

配置GBase 8a输入组件

同步GBase 8a数据源的数据至其他数据源的场景,您需要先配置GBase 8a输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置GBase 8a输入组件。前提条件 已创建GBase 8a数据源,如何创建,请参见 创建GBase 8a数据源。...

配置Impala输入组件

同步Impala数据源的数据至其他数据源的场景,您需要先配置Impala输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置Impala输入组件。前提条件 已创建Impala数据源,如何创建,请参见 创建Impala数据源 进行Impala...

配置Impala输入组件

同步Impala数据源的数据至其他数据源的场景,您需要先配置Impala输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置Impala输入组件。前提条件 已创建Impala数据源,如何创建,请参见 创建Impala数据源 进行Impala...

新建Session集群

操作步骤 在Dataphin首页,单击顶部菜单栏的 管理中心。按照下图操作指引,进入 Session集群 对话框。在 新建Session集群 对话框,配置参数。参数 描述 基本信息 集群名称 请输入Session集群名称。仅支持字母、数字、下划线(_),64个...
共有59条 < 1 2 3 4 ... 59 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能数据建设与治理 Dataphin 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用