阿里云文档 2025-02-20

Notebook开发

本文为您介绍如何在阿里云EMR Serverless Spark环境中使用Notebook进行开发,包括创建、编辑、运行、发布、导入和导出Notebook,以及在Notebook之间共享代码的操作。

阿里云文档 2024-11-28

通过DSW提交Spark应用

交互式建模(DSW)是PAI产品的云端机器学习开发IDE,支持多种语言及开发环境。您可以在DSW实例中连接云原生数据仓库 AnalyticDB MySQL 版集群,并通过其集成的Notebook、Terminal等开发环境编写PySpark脚本,提交Spark作业。本文为您介绍通过DSW实例提交Spark作业的具体操作步骤。

阿里云文档 2024-10-15

快速上手Spark Submit开发

EMR Serverless Spark兼容spark-submit命令行参数,简化了任务执行流程。本文通过一个示例,为您演示如何进行Spark Submit开发,确保您能够快速上手。

阿里云文档 2024-09-14

快速上手Notebook开发

EMR Serverless Spark支持通过Notebook进行交互式开发。本文带您快速体验Notebook的创建、运行等操作。

阿里云文档 2024-09-14

PySpark批任务开发入门

您可以自行编写并构建包含业务逻辑的Python脚本,上传该脚本后,即可便捷地进行PySpark开发。本文通过一个示例,为您演示如何进行PySpark开发。

文章 2023-12-26 来自:开发者社区

Python大数据之PySpark(三)使用Python语言开发Spark程序代码

使用Python语言开发Spark程序代码Spark Standalone的PySpark的搭建----bin/pyspark --master spark://node1:7077Spark StandaloneHA的搭建—Master的单点故障(node1,node2),zk的leader选举机制,1-2min还原【scala版本的交互式界面】bin/spark-shell --master....

Python大数据之PySpark(三)使用Python语言开发Spark程序代码
文章 2023-12-26 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)

停不要往下滑了,默默想5min,看看这些面试题你都会吗?一个CPU core同一时间只能执行一个线程。而每个Executor进程上分配到的多个task,都是以每个task一条线程的方式,多线程并发运行的。一个应用提交的时候设置多大的内存?设置多少Core?设置几个Executor?以下答案仅供参考:./bin/spark-submit \ –master yarn-cluster \ –num-....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)
文章 2023-12-26 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day17】——Spark4

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、Spark on Mesos中,什么是的粗粒度分配,什么是细粒度分配,各自的优点和缺点是什么? 面试题02、driver的功能是什么? 面试题 03、Spark技术栈有哪些组件,每个组件都有什么功能,适合什么应用场景? 面试题04、Spark中Worker的主要工作是什么? 面试题05、Mapreduce和Spark的都是并....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day17】——Spark4
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day28】——Spark15+数据倾斜1

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题01、介绍一下你对Unified Memory Management内存管理模型的理解?(了解) 面试题02、Spark的数据本地性有哪几种? 面试题03、数据倾斜是什么? 面试题04、如何定位数据倾斜? 面试题05、数据倾斜的几种典型情况?以下答案仅供参考:面试题 01、 介绍一下你对Unified Memory Manageme....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day28】——Spark15+数据倾斜1
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day27】——Spark14

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题01、spark工作机制? 面试题02、spark的优化怎么做? 面试题03、数据本地性是在哪个环节确定的? 面试题04、RDD的弹性表现在哪几点? 面试题05、RDD有哪些缺陷?以下答案仅供参考:面试题 01、 spark工作机制?① 构建Application的运行环境,Driver创建一个SparkContext② Spark....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day27】——Spark14

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注