阿里云文档 2026-06-09

同工作空间批量发布任务

DataWorks支持将需要发布的对象(节点、函数、资源、组件等)批量添加至发布包,统一发布。本文为您介绍同工作空间发布场景下如何创建及发布待发布包。

阿里云文档 2026-06-09

使用DistCp任务实现大规模文件迁移

当您需要大文件或多文件的纯文件复制时,可以使用DataWorks创建DistCp任务,该方式能够极大的提高同步传输的效率,实现跨文件系统、大规模数据迁移和同步需求。

阿里云文档 2026-06-07

通过离线同步任务实现Embedding向量化处理

阿里云DataWorks数据集成推出Embedding向量化功能,支持将分散在OSS、MaxCompute、HDFS等异构来源中的数据抽取并转化为向量,写入Milvus、Elasticsearch、Opensearch等向量库,以及Hologres向量表等具备向量存储能力的目标端,能够大幅简化ETL流程,高效实现知识向量化,助力RAG等AI场景落地。

阿里云文档 2026-06-07

创建一个具备AI处理能力的数据集成任务

该功能在DataWorks数据集成链路中,原生集成了AI大模型处理能力。它将传统的数据同步从简单的“搬运”升级为智能的“加工”,允许用户在数据从源到端的传输过程中,实时调用AI模型对流经的数据进行内容分析、处理与增强,在数据流转的过程中释放非结构化数据的隐藏价值。

阿里云文档 2026-04-13

如何配置整库离线同步任务

DataWorks的整库离线同步功能,支持将源数据库中的全部或部分表结构与数据,批量、周期性地进行全量或增量同步至目标端,是实现高效数据迁移的关键解决方案。本文将以MySQL整库迁移至MaxCompute为例,介绍配置此类任务的通用流程。

问答 2024-08-25 来自:开发者社区

DataWorks当前余量-37,意思是有可能会导致设置基线的任务A延后37分钟产出吗?

DataWorks一个重要的任务(A任务)设置了一条基线,基本信息如下:,上线第一天晚上,这个重要任务的上游有个任务(任务B)早早就预警了,?当前余量-37,意思是有可能会导致设置基线的任务A延后37分钟产出?实际上任务A昨天晚上是提前在基线设定时间(2点)前正常产出的。

问答 2024-08-21 来自:开发者社区

DataWorks设置超时定义后,比如超过 1h 任务自动失败?

DataWorks设置超时定义后,比如超过 1h 任务自动失败, 然后我设置了自动重跑,任务会自动重跑吗?

文章 2024-08-19 来自:开发者社区

DataWorks产品使用合集之设置任务监控的步骤是什么

问题一:DataWorks同步单表数据增量同步的话,时间怎么设置,怎么知道上次同步的时间? DataWorks同步单表数据增量同步的话,时间怎么设置,怎么知道上次同步的时间? 参考回答: 一般离线任务凌晨产出数据 可以使用默认时间 关于本问题的更多回答可点击原文查看: https://developer.aliyun.com/...

DataWorks产品使用合集之设置任务监控的步骤是什么
文章 2024-08-19 来自:开发者社区

DataWorks产品使用合集之怎么设置实时同步任务的速率和并发

问题一:DataWorks地域cn-chengdu-cdtaibao-d01,请问jobid在那看? DataWorks地域cn-chengdu-cdtaibao-d01,请问jobid在那看? 参考回答: jobid查看可登录DataWorks控制台 -> 项目管理 -> 选择对应项目 -> 进入工作流开发或调度管理界面,找到您想要...

DataWorks产品使用合集之怎么设置实时同步任务的速率和并发
问答 2024-07-23 来自:开发者社区

DataWorks为什么设置了这个前置依赖,就导致整个任务都被跳过了?

DataWorks为什么设置了这个前置依赖,就导致整个任务都被跳过了,dim_mdm_customer_all_md 这个 7.15 凌晨0:29就产出了 但是 dwd_rtm_dc_wms_wh_out 这个表,7.15 10:10才开始运行,并且直接成功,代码并没有真正运行,可以帮我看看原因吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

大数据开发治理平台 DataWorks任务相关内容

大数据开发治理平台 DataWorks更多任务相关

产品推荐

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注