阿里云文档 2025-12-22

读写MaxCompute

EMR Serverless Spark内置了基于Spark DataSource V2的MaxCompute DataSource,只需在开发时添加对应的配置即可连接MaxCompute。本文为您介绍在EMR Serverless Spark中实现MaxCompute的读取与写入操作。

阿里云文档 2025-12-12

Spark访问MaxCompute数据

MaxCompute开放存储支持Spark通过Connector调用Storage API,直接读取MaxCompute的数据,简化了读取数据的过程,提高了数据访问性能。同时,Spark集成MaxCompute的数据存储能力,实现了高效、灵活和强大的数据处理和分析。

阿里云文档 2025-11-19

Spark SQL访问MaxCompute数据源

本文介绍如何在云原生数据仓库 AnalyticDB MySQL 版中通过Spark SQL读写MaxCompute数据。

阿里云文档 2025-01-24

搭建运行Spark的开发环境(Windows)

本文为您介绍如何在Windows操作系统下搭建Spark on MaxCompute开发环境。

文章 2024-11-05 来自:开发者社区

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析

1. XGBoost简介 XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在GBDT框架的基础上实现机器学习算法。XGBoost提供了并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。XGBoost最初是一个研究项目,孵化于Distributed (Deep) Machine Learning Community (DMLC) ,由陈天奇博...

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
阿里云文档 2024-01-04

Spark on MaxCompute访问Lindorm报错连接超时

使用Spark on MaxCompute访问Lindorm实例时可能会出现Connection Timeout的报错,这可能涉及Spark on MaxCompute的网络架构和数据通信方式等多方面的影响。本文介绍出现Connection Timeout报错的原因和解决方法。

问答 2023-06-09 来自:开发者社区

MaxCompute里如果我换成spark代码。昨天的功能可以实现吗?

请教一下,如果我换成spark代码。昨天的功能可以实现吗?后面用JDBC太慢了,最后还是执行错误,显示的也是网络错误,如果是直接写spark代码直接写进目标表,这种以前有小伙伴试验过能行不,是不是只有包年包月的才可以,后付费模式是不行的是吗,这个需要dataworks的版本是包年包月的是吧这个命令是在哪里执行的呢,我看如果是自己的就是直接在服务器运行,咋们这是在哪里运行呢?还有就是这个能不能和数....

问答 2021-12-12 来自:开发者社区

MaxCompute Spark中要在代码中访问配置项该如何去做呢?

MaxCompute Spark中要在代码中访问配置项该如何去做呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注