文章 2017-02-27 来自:开发者社区

DataX使用指南——ODPS to ODPS

1. DataX是什么 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。 DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以及向目标端写入数据的Writer插件,理....

问答 2016-11-28 来自:开发者社区

如何使用DataX将表格存储内的Binary类型数据导入到ODPS?

表格存储内部分字段是binary类型,而ODPS不支持binary类型,只支持String。在将表格存储内binary类型数据导入到ODPS的String字段之后,再读出来,发现数据不对,有丢失。我应该怎么把binary类型数据导入到ODPS?

阿里云 DTS是如何做实时数据集成的?

1 课时 |
214 人已学 |
免费
开发者课程背景图
文章 2016-05-26 来自:开发者社区

用Fluent实现MySQL到ODPS数据集成

安装ruby 首先通过 /etc/issue 命令查看当前使用centos是哪个版本: [hadoop@hadoop03 ~]$  cat /etc/issue 由于centos版本是6.6,安装ruby时就要选择在centos 6.X环境,具体安装步骤参考如下所示即可! yum install gcc-c++ patch readline readline...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注