阿里云文档 2026-02-04

在PyODPS节点引用第三方包

当标准的PyODPS功能无法满足复杂的业务需求时,开发者需要复用已有的Python代码逻辑,或利用开源库来完成任务。为此,DataWorks 提供两种核心方案:通过资源引用灵活加载自定义脚本,或通过配置执行环境(如自定义镜像、运维助手)来集成功能强大的第三方包。本文介绍如何在DataWorks的PyODPS节点中调用自定义Python脚本或安装并使用开源第三方包,以扩展数据处理能力。

阿里云文档 2026-02-04

大模型数据处理节点

在传统的数据工作流中,处理像用户评论、产品描述、客服日志等非结构化文本数据一直是一项挑战。您现在可以直接在DataWorks的工作流中,利用强大的大语言模型(LLM)能力,通过自然语言指令,轻松完成文本摘要、情感分析、内容分类、信息提取等复杂的AI任务。这极大地简化数据处理流程,让数据工程师和分析师无需编写复杂的算法,即可将AI能力无缝集成到现有的ETL(数据抽取、转换、加载)链路中。

阿里云文档 2025-10-28

在节点、个人开发环境中使用数据集

在节点(Shell节点、Python节点、Notebook节点)中使用数据集,以便在数据开发过程中读写NAS或OSS存储中的数据。也可以在创建个人开发环境时,将数据集作为个人开发环境实例的存储。

阿里云文档 2025-07-15

数据推送节点

数据推送节点可将Data Studio业务流程中其他节点产生的数据查询结果,通过新建数据推送目标,将数据推送至钉钉群、飞书群、企业微信群、Teams以及邮件,便于团队成员及时接收和关注最新数据情况。

阿里云文档 2025-06-13

PAI Flow的配置与运维

PAI Flow提供端到端机器学习流程开发能力,可实现与人工智能平台 PAI 的可视化建模 Desiger相同的工作流功能,并能周期性调度工作流。

问答 2024-08-25 来自:开发者社区

DataWorks中check节点的任务会一直占用调度并行度吗?

DataWorks中check节点的任务会一直占用调度并行度吗,比如调度资源组的并行度是20,然后我设置了21个check节点,都是凌晨1点开始,没5分钟检查一次,会导致调度资源组的并行度被打满,导致其它任务如hive 无法执行的情况吗?

问答 2024-08-05 来自:开发者社区

DataWorks有办法确认pai节点为什么改公共调度资源组-->独享调度资源组会报错吗?

DataWorks有办法确认pai节点为什么改公共调度资源组-->独享调度资源组会报错吗?

问答 2024-07-23 来自:开发者社区

DataWorks中a节点的调度时间是 2点 12点 15点 是这样的吗?

DataWorks中a节点的调度时间是 2点 12点 15点 然后b解决依赖b节点 调度时间是 1点 ,那执行流程是 先2点的a节点跑 然后在是1点的b节点跑 然后再是 12点的a节点 15点的a节点pao 是这样的吗?

文章 2024-06-30 来自:开发者社区

DataWorks产品使用合集之赋值和分支节点在5分钟调度一次的场景下是否可以使用

问题一:为啥今天DataWorks页面反应速度那么慢呀?点一个按键隔半分钟或半分钟以上才能有反应? 为啥今天DataWorks页面反应速度那么慢呀?点一个按键隔半分钟或半分钟以上才能有反应? 参考回答: 打通网络,chrome无痕模式也是一样的吗,刚试了一下深圳运行 打开业务流程等没有出现等半分钟的情况   关于本问题的更多回答可点击...

问答 2024-06-30 来自:开发者社区

DataWorks如果两个集成节点 选择的并发数 都是 8,那调度资源就会占满对吗 ?

DataWorks这边这个 最大并发实例数 16 , 如果两个集成节点 选择的并发数 都是 8,那调度资源就会占满对吗 ?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

大数据开发治理平台 DataWorks节点相关内容

大数据开发治理平台 DataWorks更多节点相关

产品推荐

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注