阿里云文档 2026-04-13

Shell类型节点运行Python脚本

DataWorks的Shell类型节点支持运行Python脚本。本文将为您介绍如何使用通用Shell节点或EMR Shell节点运行Python 2或Python 3脚本。

阿里云文档 2026-04-09

配置Python节点实现任务周期性调度-大数据开发治理平台 DataWorks-阿里云

Python节点支持Python3语法(不支持Python2语法),您可以在该节点中直接使用Python代码,并进行作业的周期性调度。本文为您介绍如何通过DataWorks实现Python任务的配置和调度。

阿里云文档 2026-03-30

MaxCompute AI Function提供低代码、多引擎支持的预定义函数,简化大模型与机器学习推理在大数据场景中的应用。更加便捷的通过SQL或Python调用大模型和机器学习能力。

AI Function是MaxCompute提供的一组面向AI业务场景的预定义函数,将复杂的AI 推理操作封装为简洁的SQL或Python算子。用户无需编写底层模型调用代码,即可通过标准SQL或MaxFrame(分布式Python引擎)直接调用大模型或机器学习模型,显著降低用户在数据处理、大数据分析等场景的AI使用门槛。

阿里云文档 2025-12-12

开放存储SDK示例-Python SDK

MaxCompute支持第三方引擎(如Spark on EMR、StarRocks、Presto、PAI和Hologres)通过SDK调用Storage API直接访问MaxCompute数据,本文为您介绍使用Python SDK访问MaxCompute的代码示例。

文章 2023-12-26 来自:开发者社区

Python大数据之PySpark(六)RDD的操作

RDD的操作函数分类*Transformation操作只是建立计算关系,而Action 操作才是实际的执行者*。Transformation算子转换算子操作之间不算的转换,如果想看到结果通过action算子触发Action算子行动算子触发Job的执行,能够看到结果信息Transformation函数值类型valueTypemapflatMapfiltermapValue双值类型DoubleVal....

Python大数据之PySpark(六)RDD的操作
文章 2023-12-26 来自:开发者社区

Python大数据之PySpark(五)RDD详解

RDD详解为什么需要RDD?首先Spark的提出为了解决MR的计算问题,诸如说迭代式计算,比如:机器学习或图计算希望能够提出一套基于内存的迭代式数据结构,引入RDD弹性分布式数据集,如下图为什么RDD是可以容错?RDD依靠于依赖关系dependency relationshipreduceByKeyRDD-----mapRDD-----flatMapRDD另外缓存,广播变量,检查点机制等很多机制....

Python大数据之PySpark(五)RDD详解

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像