阿里云文档 2025-12-09

如何配置整库离线同步任务

DataWorks的整库离线同步功能,支持将源数据库中的全部或部分表结构与数据,批量、周期性地进行全量或增量同步至目标端,是实现高效数据迁移的关键解决方案。本文将以MySQL整库迁移至MaxCompute为例,介绍配置此类任务的通用流程。

阿里云文档 2025-11-03

使用DistCp任务实现大规模文件迁移

当您需要大文件或多文件的纯文件复制时,可以使用DataWorks创建DistCp任务,该方式能够极大的提高同步传输的效率,实现跨文件系统、大规模数据迁移和同步需求。

阿里云文档 2025-10-24

本文介绍了使用VS Code、通义灵码和spark-submit工具自动生成PySpark任务代码并提交至EMR Serverless Spark的全流程方法,显著简化了开发与执行复杂度。

通过VS Code、通义灵码以及Serverless Spark提供的spark-submit工具,用户能够快速生成Spark任务代码并将其提交至Serverless Spark进行执行。本文将为您详细介绍如何使用上述工具提交Serverless Spark任务。

阿里云文档 2025-10-16

通过离线同步任务实现Embedding向量化处理

阿里云DataWorks数据集成推出Embedding向量化功能,支持将分散在OSS、MaxCompute、HDFS等异构来源中的数据抽取并转化为向量,写入Milvus、Elasticsearch、Opensearch等向量库,以及Hologres向量表等具备向量存储能力的目标端,能够大幅简化ETL流程,高效实现知识向量化,助力RAG等AI场景落地。

文章 2024-09-09 来自:开发者社区

如何对付一个耗时6h+的ODPS任务:慢节点优化实践

一、背景 二、快速止血 2.1、耗时卡点定位 先来看看这个让人头疼的慢节点,长什么样子?让我看看你是何方神圣。 ...

如何对付一个耗时6h+的ODPS任务:慢节点优化实践
问答 2024-08-08 来自:开发者社区

MaxCompute支持并行计算以加速数据处理任务。要优化并行度,如何调整参数?

MaxCompute支持并行计算以加速数据处理任务。要优化并行度,如何调整参数?

问答 2024-07-24 来自:开发者社区

大数据计算MaxCompute任务长时间卡在这个 阶段,如何优化?

大数据计算MaxCompute任务长时间卡在 MergeFinalizeTask__merge 阶段,如何优化?https://dataworks.data.aliyun.com/cn-hangzhou/workbench?defaultProjectId=4130&env=prod&isOdpsTask=1&taskId=6845807180&userProjec...

文章 2024-04-22 来自:开发者社区

一文解析 ODPS SQL 任务优化方法原理

一、背景 使用ODPS SQL进行离线数据研发时,开发同学不可避免会碰到任务性能问题,需要经常对ODPS SQL执行任务进行调优,以对重点场景任务产出时效进行保障,避免资源浪费。调优过程需要参考相关优化文档资料,发现技术网站中有很多文章介绍到相关的优化方法,但从ODPS底层执行计划来解释为什么要这样做优化以及背后的依据是什么的介绍文章比较少。本文尝试从ODPS底层逻辑计划拆解部...

一文解析 ODPS SQL 任务优化方法原理
问答 2023-11-30 来自:开发者社区

请教下大数据计算MaxCompute,这个jobs任务,有没有优化的方法呢?

请教下大数据计算MaxCompute,这个jobs任务,在这个节点一直卡在90%,跑一个多小时了,有没有优化的方法呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute任务相关内容

云原生大数据计算服务 MaxCompute更多任务相关

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注