阿里云文档 2025-01-26

使用Python访问EMR HBase

通过HBase Thrift Server,您可以方便地使用多种编程语言与EMR HBase集群进行交互,满足不同开发环境的需求。使用Thrift Server,您无需依赖Java客户端即可高效访问和操作HBase中的数据。

阿里云文档 2025-01-24

开放存储SDK示例-Python SDK

MaxCompute支持第三方引擎(如Spark on EMR、StarRocks、Presto、PAI和Hologres)通过SDK调用Storage API直接访问MaxCompute数据,本文为您介绍使用Python SDK访问MaxCompute的代码示例。

阿里云文档 2024-11-14

Shell类型节点运行Python脚本

DataWorks的Shell类型节点支持运行Python脚本。本文将为您介绍如何使用通用Shell节点或EMR Shell节点运行Python 2或Python 3脚本。

阿里云文档 2024-10-22

PySpark中的Python环境介绍

EMR DataLake和自定义集群安装的Spark版本对Python环境的依赖各不相同。本文以Python3为例,介绍不同Spark版本所对应的Python版本,以及安装Python第三方库的方法。

文章 2024-07-08 来自:开发者社区

​「Python大数据」VOC数据统计聚类

前言 本文主要介绍通过python实现数据聚类、脚本开发、办公自动化。读取voc数据,聚类voc数据。 一、业务逻辑 读取voc数据采集的数据 批处理,使用jieba进行分词,去除停用词,词频统计聚类 保存聚类后的数据写入到.txt文件中二、具体产出 三、执行脚本 python learning.py 四、脚本 # VOC数据聚类 import pandas as pd...

​「Python大数据」VOC数据统计聚类
文章 2024-07-08 来自:开发者社区

​「Python大数据」VOC数据清洗

前言 本文主要介绍通过python实现数据清洗、脚本开发、办公自动化。读取voc数据,存储新清洗后的voc数据数据。 一、业务逻辑 读取voc数据采集的数据 批处理,使用jieba进行分词,去除停用词,清洗后的评论存储到新的列中 保存清洗后的数据到新的Excel文件中二、具体产出 三、执行脚本 python clean.py 四、脚本 # voc数据清洗 import ...

​「Python大数据」VOC数据清洗
阿里云文档 2023-11-10

如何使用PythonClient编程方式访问TrinoOnACK服务_EMR on ACK_开源大数据平台 E-MapReduce(EMR)

本文为您介绍如何使用Python Client编程的方式访问Trino On ACK服务并执行查询操作。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像