阿里云文档 2025-12-05

Spark on MaxCompute访问云数据库HBase的配置方法

本文介绍Spark on MaxCompute访问云数据库HBase的配置方法。

阿里云文档 2025-10-24

本文介绍了使用VS Code、通义灵码和spark-submit工具自动生成PySpark任务代码并提交至EMR Serverless Spark的全流程方法,显著简化了开发与执行复杂度。

通过VS Code、通义灵码以及Serverless Spark提供的spark-submit工具,用户能够快速生成Spark任务代码并将其提交至Serverless Spark进行执行。本文将为您详细介绍如何使用上述工具提交Serverless Spark任务。

问答 2024-07-29 来自:开发者社区

调整Spark读取ODPS离线表分区大小的方法是什么?

调整Spark读取ODPS离线表分区大小的方法是什么?

阿里云文档 2024-07-26

Spark作业异常的排查方法和解决方案

本文介绍Spark作业异常的排查方法和解决方案。

阿里云文档 2024-06-28

Spark服务异常的排查方法和解决方案

本文介绍Spark服务异常的排查方法和解决方案。

文章 2024-01-18 来自:开发者社区

Spark中的性能优化有哪些方法?请举例说明

Spark中的性能优化有哪些方法?请举例说明。在Spark中,有许多方法可以进行性能优化,以提高作业的执行效率和减少运行时间。下面是一些常用的性能优化方法,并结合具体案例进行说明。数据压缩:通过对数据进行压缩,可以减少数据的存储空间和网络传输的数据量,从而提高作业的执行效率。Spark支持多种压缩格式,如Gzip、Snappy和LZO等。下面是一个使用数据压缩的示例:import org.apa....

文章 2023-05-18 来自:开发者社区

教材P164操作题。编写Spark Steaming程序,使用leftOuterJoin操作及filter方法过滤掉黑名单的数据

import java.util.ArrayList; import java.util.Arrays; import java.util.List; import java.util.regex.Pattern; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org....

文章 2022-10-28 来自:开发者社区

一天学完spark的Scala基础语法教程四、方法与函数(idea版本)

创建测试类【day1/demo4.scalc】,注意类型是【object】 Scala 方法与函数Scala 有方法与函数,二者在语义上的区别很小。Scala 方法是类的一部分,而函数是一个对象可以赋值给一个变量。换句话来说在类中定义的函数即是方法。Scala 中的方法跟 Java 的类似,方法是组成类的一部分。Scala 中的函数则是一个完整的对象,Scala 中的函数其实就是继承了....

一天学完spark的Scala基础语法教程四、方法与函数(idea版本)
文章 2022-10-11 来自:开发者社区

Spark SQL DataFrame查询和输出函数一文详解运用与方法

前言配置的虚拟机为Centos6.7系统,hadoop版本为2.6.0版本,先前已经完成搭建CentOS部署Hbase、CentOS6.7搭建Zookeeper和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了Hive详解以及CentOS下部署Hive和Mysql和Spark框架在CentOS下部署搭建。Spark的组件Spark SQL的部署:S....

Spark SQL DataFrame查询和输出函数一文详解运用与方法
文章 2022-10-11 来自:开发者社区

Spark SQL DataFrame查看函数一文详解运用与方法

前言配置的虚拟机为Centos6.7系统,hadoop版本为2.6.0版本,先前已经完成搭建CentOS部署Hbase、CentOS6.7搭建Zookeeper和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了Hive详解以及CentOS下部署Hive和Mysql和Spark框架在CentOS下部署搭建。Spark的组件Spark SQL的部署:S....

Spark SQL DataFrame查看函数一文详解运用与方法

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注