阿里云文档 2025-06-10

Shell类型节点运行Python脚本

DataWorks的Shell类型节点支持运行Python脚本。本文将为您介绍如何使用通用Shell节点或EMR Shell节点运行Python 2或Python 3脚本。

阿里云文档 2025-06-04

开放存储SDK示例-Python SDK

MaxCompute支持第三方引擎(如Spark on EMR、StarRocks、Presto、PAI和Hologres)通过SDK调用Storage API直接访问MaxCompute数据,本文为您介绍使用Python SDK访问MaxCompute的代码示例。

阿里云文档 2025-04-09

在PySpark程序中使用Python第三方库

PySpark作业往往需要借助Python第三方库来增强数据处理和分析能力。本文档详细介绍了如何利用Conda和PEX这两种方法,有效地将这些库集成到Serverless Spark环境中,确保作业在分布式计算场景下的稳定性和灵活性。

阿里云文档 2025-01-26

使用Python访问EMR HBase

通过HBase Thrift Server,您可以方便地使用多种编程语言与EMR HBase集群进行交互,满足不同开发环境的需求。使用Thrift Server,您无需依赖Java客户端即可高效访问和操作HBase中的数据。

阿里云文档 2024-10-22

PySpark中的Python环境介绍

EMR DataLake和自定义集群安装的Spark版本对Python环境的依赖各不相同。本文以Python3为例,介绍不同Spark版本所对应的Python版本,以及安装Python第三方库的方法。

文章 2017-08-01 来自:开发者社区

Python+大数据计算平台,PyODPS架构手把手教你搭建

数据分析和机器学习 大数据基本都是建立在Hadoop系统的生态上的,其实一个Java的环境。很多人喜欢用Python和R来进行数据分析,但是这往往对应一些小数据的问题,或者本地数据处理的问题。如何将二者进行结合使其具有更大的价值?Hadoop现有的生态系统和现有的Python环境如上图所示。 MaxCompute MaxCompute是面向离线计算的大数据平台,提供TB/PB级的数据处理,多租.....

文章 2016-11-14 来自:开发者社区

Python+大数据计算平台,PyODPS架构手把手教你搭建

免费开通大数据服务:https://www.aliyun.com/product/odps 在2016年10月的云栖社区在线培训上,来自阿里云大数据事业部的秦续业分享了《双剑合壁——Python和大数据计算平台的结合实战》。他主要介绍了数据分析和机器学习的方法、DataFrame整体架构以及基础API、前端、后端、机器学习的具体实现方法。 回顾视频链接:https://yq.aliyun.com....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像