您在构建数据仓库之前,首先需要确定构建数据仓库的目标与需求,并进行全面的业务调研。您需要了解真实的业务需求,以及确定数据仓库要解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功...
业务切换前,为了防止风险的发生(例如发现迁移的数据有误、新迁移的数据不符合预期等),建议开启 回流迁移 功能,将切换后新写入目标数据库的业务数据同步到源数据库,从而及时实现可逆的操作。说明 当前您需要 联系我们 申请开启 回流...
基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...
请确保与目标表关联的业务不会被影响。实现流程 移除同步实例报错信息中的表或热点表。清空目标库中报错信息表的数据。重新添加报错信息中的表到同步实例中。操作步骤 进入同步任务的列表页面。登录 DMS数据管理服务。在顶部菜单栏中,单击...
对访问量和数据量较大的业务中心,例如订单中心,PolarDB-X 采用了水平拆分的方式,结合弹性升降配和平滑扩容使数据库具备了100 TB数据存储的能力、10万TPS、百万QPS的支撑能力,可以支撑特步扩展业务至当前业务量的5~10倍。从数据的实时性...
如果您前一步中目标数据源使用的 Topic建立方式 为 自动建Topic,则需要在弹出的 自动建表 对话框,单击 开始建表,批量创建目标DataHub Topic。运行资源设置。在 运行资源设置 页面,配置各项参数。参数 描述 来源端读取支持最大连接数 ...
计算资源类型 选择需要同步到的目标数据源的类型,目前支持的目标数据源类型参见 适用场景 目标数据源 选择同步到的目标数据源。目标数据表 选择同步到的目标数据源中的表名。生命周期(可选)设置目标表的留存天数,如未设置,默认将保留1...
数据开发更简单:平台提供的各种工具产品能够极大的简化数据开发过程,缩短数据治理周期,降低数据治理成本。通过标准化、精细化、规格化的智能数据生产流程,完成流水线式的数据生产作业,提升数据资源生产效率、消除数据供应品质差异。...
说明 适用于当前节点被设置为暂停调度,在选中的补数据业务日期需要正常运行的场景。空跑调度任务对应实例 配置空跑调度的任务生成的补数据实例的运行状态:空跑:若选择空跑,则选中的空跑调度任务生成的补数据实例将直接空跑成功。正常...
说明 适用于当前节点被设置为暂停调度,在选中的补数据业务日期需要正常运行的场景。空跑调度任务对应实例 配置空跑调度的任务生成的补数据实例的运行状态:空跑:若选择空跑,则选中的空跑调度任务生成的补数据实例将直接空跑成功。正常...
删除数据 单个删除:在数据列表,单击目标数据 操作 列的 更多,选择 删除,删除目标数据。批量删除:在数据列表,选中一个或者多个目标数据,单击页面左下角的 批量删除,批量删除数据。发布服务 在数据列表,单击目标数据 操作 列的 发布...
同步Oracle数据源的数据至其他数据源的场景中,您需要先配置Oracle输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Oracle输入组件。操作步骤 请参见 通过离线单条管道配置集成任务,进入离线管道脚本的开发...
用户在业务系统中,通过埋点或日常积累的方式,获取了充足的业务数据。为梳理数据之间的逻辑关系和流向,需要理解用户的业务过程及数据系统。您可以采用过程分析法,列出整个业务过程涉及的每个环节,包括技术、数据、系统环境等。分析完...
用户的业务系统中,通过埋点或日常积累,通常已经获取了充足的业务数据。为理清数据之间的逻辑关系和流向,首先需要理解用户的业务过程,了解过程中涉及到的数据系统。您可以采用过程分析法,将整个业务过程涉及的每个环节一一列清楚,包括...
用户的业务系统中,通过埋点或日常积累,通常已经获取了充足的业务数据。为理清数据之间的逻辑关系和流向,首先需要理解用户的业务过程,了解过程中涉及到的数据系统。您可以采用过程分析法,将整个业务过程涉及的每个环节一一列清楚,包括...
贴源层(ODS):是在STG层数据加工汇总后形成的业务系统的原始数据。通用层:一般用于通用任务或者同时做多种类型的任务开发。安全设置 使用 默认配置。更多设置 使用 默认配置。单击 确定。步骤四:创建 源数据源 在Dataphin首页,单击...
由于全量数据同步会并发执行INSERT操作,导致目标数据库的集合产生碎片,因此全量同步完成后目标数据库的集合存储空间会比源实例的集合存储空间大。在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。...
由于全量数据同步会并发执行INSERT操作,导致目标数据库的集合产生碎片,因此全量同步完成后目标数据库的集合存储空间会比源实例的集合存储空间大。在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。...
DataWorks的数据溯源功能,支持通过提取数据泄露文件中数据的水印信息,帮助您定位到可能会泄露目标数据的责任人。本文为您介绍如何创建溯源任务,并通过该任务查找可能会泄露数据的责任人。前提条件 已创建 数据识别规则,详情请参见 配置...
为保障数据迁移任务的顺利执行,在预检查阶段检查DTS服务器是否能够连通要迁移的目标数据库。本文将介绍目标数据库连接性检查失败可能的原因及修复方法。当目标数据库连接性预检查失败时,可能是以下几种原因。数据库账号或数据库密码不...
并发数大,同步任务速率高,但相对也会消耗更多的资源组槽位,并发数小,同步速率相对较低,相对消耗的资源组槽位也较少 离线任务是否开启限流 您可以通过限流控制同步速率,以保护读取端数据库,避免抽取速度过大,给源库造成太大的压力,...
同步Greenplum数据源的数据至其他数据源的场景中,您需要先配置Greenplum输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置Greenplum输入组件。操作步骤 请参见 离线管道组件开发入口,进入离线管道脚本的开发页面...
同步MySQL数据源的数据至其他数据源的场景中,您需要先配置MySQL输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置MySQL输入组件。操作步骤 请参见 离线管道组件开发入口,进入离线管道脚本的开发页面。按照下图...
同步MySQL数据源的数据至其他数据源的场景中,您需要先配置MySQL输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置MySQL输入组件。操作步骤 请参见 离线管道组件开发入口,进入离线管道脚本的开发页面。按照下图...
同步Oracle数据源的数据至其他数据源的场景中,您需要先配置Oracle输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Oracle输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建Oracle数据...
同步TiDB数据源的数据至其他数据源的场景中,您需要先配置TiDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置TiDB输入组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输入组件属性...
在基于HBase、Elasticsearch或MongoDB数据源创建服务单元之前,需要先创建对应数据源中数据表的元数据,以实现通过元数据确定数据源中数据表的结构。后续您可以通过该元数据读取到对应数据源的数据。本文为您介绍如何创建HBase、...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。主题域 数据域即主题域,是对某个主题分析后确定的主题边界。例如,商品域、交易域、会员域等。项目 ...
同步PolarDB数据源的数据至其他数据源的场景中,您需要先配置PolarDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置PolarDB输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建PolarDB数据源...
同步TiDB数据源的数据至其他数据源的场景中,您需要先配置TiDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置TiDB输入组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输入组件属性...
同步KingbaseES数据源的数据至其他数据源的场景中,您需要先配置KingbaseES输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置KingbaseES输入组件。前提条件 已创建KingbaseES数据源,如何创建,请参见 创建...
同步Impala数据源的数据至其他数据源的场景中,您需要先配置Impala输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置Impala输入组件。前提条件 已创建Impala数据源,如何创建,请参见 创建Impala数据源 进行Impala...
同步OpenGauss数据源的数据至其他数据源的场景中,您需要先配置OpenGauss输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置OpenGauss输入组件。前提条件 已创建OpenGauss数据源,如何创建,请参见 创建OpenGauss...
同步PolarDB数据源的数据至其他数据源的场景中,您需要先配置PolarDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置PolarDB输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建PolarDB数据源...
同步GBase 8a数据源的数据至其他数据源的场景中,您需要先配置GBase 8a输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置GBase 8a输入组件。前提条件 已创建GBase 8a数据源,如何创建,请参见 创建GBase 8a数据源。...
同步GBase 8a数据源的数据至其他数据源的场景中,您需要先配置GBase 8a输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置GBase 8a输入组件。前提条件 已创建GBase 8a数据源,如何创建,请参见 创建GBase 8a数据源。...
同步GoldenDB数据源的数据至其他数据源的场景中,您需要先配置GoldenDB输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置GoldenDB输入组件。前提条件 已创建GoldenDB数据源,如何创建,请参见 创建Golden DB数据源...
由于全量数据迁移会并发执行INSERT操作,导致目标数据库的集合产生碎片,因此全量迁移完成后目标数据库的集合存储空间会比源实例的集合存储空间大。DTS会尝试恢复七天之内迁移失败任务。因此业务切换至目标实例前,请务必结束或释放该任务...
由于全量数据迁移会并发执行INSERT操作,导致目标数据库的集合产生碎片,因此全量迁移完成后目标数据库的集合存储空间会比源实例的集合存储空间大。DTS会尝试恢复七天之内迁移失败任务。因此业务切换至目标实例前,请务必结束或释放该任务...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...