问答 2022-06-28 来自:开发者社区

请教个问题,周期性全量同步到MaxCompute,目标表可以不分区吗?数据集成配置里,似乎只允许按天

请教个问题,周期性全量同步到MaxCompute,目标表可以不分区吗?数据集成配置里,似乎只允许按天分区。

问答 2022-06-24 来自:开发者社区

麻烦问下dataworks数据集成mysql-》maxcompute后decimal类型不一致

都变成了decimal(10,0)

阿里云文档 2022-05-25

Dataphin管道任务将Oracle数据集成到MaxCompute时,运行报错:\"java.lang.NullPointerException:null、[DlinkTrans-字段计算_1]ERRORDlinkTaskPluginCollector-脏数据\"

问题描述配置管道任务将Oracle数据库集成到MaxCompute数据库,使用“字段计算”组件中MD5函数将字段CUST_NO进行加密之后,任务运行报空指针和脏数据的错误,具体异常堆栈信息如下:2021-09-07 17:40:10.446 [0-0-0-reader] INFO  CommonRd...

问答 2021-12-13 来自:开发者社区

MaxCompute中如何避免使用各种数据集成工具产生小文件?

MaxCompute中如何避免使用各种数据集成工具产生小文件?

问答 2021-12-12 来自:开发者社区

云数据仓库MaxCompute与数据集成的关系是什么?

云数据仓库MaxCompute与数据集成的关系是什么?

文章 2020-09-07 来自:开发者社区

阿里云Dataworks数据集成工具实现:OTS -> Maxcompute数据同步

Step By Step 1、配置数据源 + 测试连通性 1.1 Table Store(OTS)参数获取 1.2、AccessKey、AccessSecret获取阿里云常见参数获取位置 1.3 Dataworks数据集成配置OTS数据源 1.4 Maxcompute数据源配置 2、源数据准备及目标表创建 2.1 OTS 源数据表 2.2 odps数据表创建 CREATE TAB...

阿里云Dataworks数据集成工具实现:OTS -> Maxcompute数据同步
文章 2019-05-13 来自:开发者社区

使用DataX同步MaxCompute数据到TableStore(原OTS)优化指南

概述 现在越来越多的技术架构下会组合使用MaxCompute和TableStore,用MaxCompute作大数据分析,计算的结果会导出到TableStore提供在线访问。MaxCompute提供海量数据计算的能力,而TableStore提供海量数据高并发低延迟读写的能力。 将 MaxCompute内数据导出至TableStore,目前可选的几种主要途径包括: 自己编写工具:使用MaxCompu....

文章 2019-04-01 来自:开发者社区

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

通过DataWorks归档日志服务数据至MaxCompute但是会遇到大家在分区上或者DataWorks调度参数配置问题,具体拿到真实的case模拟如下:创建数据源:步骤1      进入数据集成,点击作业数据源,进入Tab页面。步骤2      点击右上角新增数据源,选择消息队列 loghub。步骤3 编辑...

文章 2018-12-10 来自:开发者社区

数据集成到MaxCompute的N种最佳实践(持续更新)

本文汇总数据集成到MaxCompute的各种最佳实践,希望可以帮助到正在或者即将使用MaxCompute的企业和开发者们。 | Hadoop数据迁移MaxCompute| 理论与实践:如何从Hadoop迁移到MaxCompute| Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南| RDS迁移到MaxCompute实现动态分区最佳实践 | MaxCompute_2....

数据集成到MaxCompute的N种最佳实践(持续更新)
文章 2018-11-03 来自:开发者社区

离线数据同步神器:DataX,支持几乎所有异构数据源的离线同步到MaxCompute

概述 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。 DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注