阿里云文档 2026-06-16

如何配置整库离线同步任务

DataWorks的整库离线同步功能,支持将源数据库中的全部或部分表结构与数据,批量、周期性地进行全量或增量同步至目标端,是实现高效数据迁移的关键解决方案。本文将以MySQL整库迁移至MaxCompute为例,介绍配置此类任务的通用流程。

阿里云文档 2026-06-15

MySQL整库离线同步到Hive

本文以MySQL为源端,Hive为目标端场景为例,为您介绍如何把MySQL整个数据库的数据离线同步到Hive。

阿里云文档 2026-06-07

通过离线同步任务实现Embedding向量化处理

阿里云DataWorks数据集成推出Embedding向量化功能,支持将分散在OSS、MaxCompute、HDFS等异构来源中的数据抽取并转化为向量,写入Milvus、Elasticsearch、Opensearch等向量库,以及Hologres向量表等具备向量存储能力的目标端,能够大幅简化ETL流程,高效实现知识向量化,助力RAG等AI场景落地。

阿里云文档 2026-06-07

创建一个具备AI处理能力的数据集成任务

该功能在DataWorks数据集成链路中,原生集成了AI大模型处理能力。它将传统的数据同步从简单的“搬运”升级为智能的“加工”,允许用户在数据从源到端的传输过程中,实时调用AI模型对流经的数据进行内容分析、处理与增强,在数据流转的过程中释放非结构化数据的隐藏价值。

阿里云文档 2026-06-07

MySQL整库离线同步到OSS数据湖

数据集成目前支持将AnalyticDB for MySQL 3.0、MySQL、Oracle、PolarDB、PostgreSQL等源头的数据整库离线同步至OSS。本文以MySQL为源端,OSS为目标端场景为例,为您介绍如何将MySQL整个数据库的数据离线同步到OSS数据湖。

问答 2024-06-11 来自:开发者社区

DataWorks离线同步给kafka时,哪里可以改这个参数?

DataWorks离线同步给kafka时,长度超过max.request.size,max.request.size是kafka的参数还是maxcomputer的参数,哪里可以改这个参数?The message is 23323371 bytes when serialized which is larger than the maximum request size you have conf....

问答 2024-06-11 来自:开发者社区

DataWorks中json格式离线同步到kafka之后再kafka看都变成文本了,这个要怎么调整?

DataWorks中json格式离线同步到kafka之后再kafka看都变成文本了,这个要怎么调整?

问答 2023-09-06 来自:开发者社区

DataWorks中离线同步kafka数据?

DataWorks中离线同步kafka数据?

问答 2023-06-17 来自:开发者社区

DataWorks离线同步数据写入kafka超时报脏数据怎么办?

DataWorks离线同步数据写入kafka超时报脏数据怎么办?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

大数据开发治理平台 DataWorks离线同步相关内容

大数据开发治理平台 DataWorks更多离线同步相关

产品推荐

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注