文章 2023-12-26 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)

停不要往下滑了,默默想5min,看看这些面试题你都会吗?一个CPU core同一时间只能执行一个线程。而每个Executor进程上分配到的多个task,都是以每个task一条线程的方式,多线程并发运行的。一个应用提交的时候设置多大的内存?设置多少Core?设置几个Executor?以下答案仅供参考:./bin/spark-submit \ –master yarn-cluster \ –num-....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)
文章 2023-12-26 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day17】——Spark4

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、Spark on Mesos中,什么是的粗粒度分配,什么是细粒度分配,各自的优点和缺点是什么? 面试题02、driver的功能是什么? 面试题 03、Spark技术栈有哪些组件,每个组件都有什么功能,适合什么应用场景? 面试题04、Spark中Worker的主要工作是什么? 面试题05、Mapreduce和Spark的都是并....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day17】——Spark4
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day28】——Spark15+数据倾斜1

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题01、介绍一下你对Unified Memory Management内存管理模型的理解?(了解) 面试题02、Spark的数据本地性有哪几种? 面试题03、数据倾斜是什么? 面试题04、如何定位数据倾斜? 面试题05、数据倾斜的几种典型情况?以下答案仅供参考:面试题 01、 介绍一下你对Unified Memory Manageme....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day28】——Spark15+数据倾斜1
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day27】——Spark14

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题01、spark工作机制? 面试题02、spark的优化怎么做? 面试题03、数据本地性是在哪个环节确定的? 面试题04、RDD的弹性表现在哪几点? 面试题05、RDD有哪些缺陷?以下答案仅供参考:面试题 01、 spark工作机制?① 构建Application的运行环境,Driver创建一个SparkContext② Spark....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day27】——Spark14
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day26】——Spark13

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、RDD的数据结构是怎么样的? 面试题02、简述Spark on yarn的作业提交流程 面试题 03、Spark的有几种部署模式,每种模式特点? 面试题04、Spark为什么比mapreduce快? 面试题05、简单说一下hadoop和spark的shuffle相同和差异?以下答案仅供参考:面试题 01、 RDD的数据结构是....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day26】——Spark13
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day25】——Spark12

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、CAPCACITY调度模式的优点和缺点? 面试题02、常见的数压缩方式,你们生产集群采用了什么压缩方式,提升了多少效率? 面试题 03、使用scala代码实现WordCount? 面试题04、Spark RDD 和 MapReduce2的区别? 面试题05、spark和Mapreduce快?为什么快呢?快在哪里呢?以下答案仅....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day25】——Spark12
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day24】——Spark11

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、spark.default.parallelism这个参数有什么意义,实际生产中如何设置? 面试题02、spark.shuffle.memoryFraction参数的含义,以及优化经验? 面试题 03、Spark中standalone模式特点,有哪些优点和缺点? 面试题04、FIFO调度模式的基本原理、优点和缺点? 面试题0....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day24】——Spark11
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day23】——Spark10

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、union操作是产生宽依赖还是窄依赖? 面试题02、窄依赖父RDD的partition和子RDD的parition是不是都是一对一的关系? 面试题 03、Hadoop中,Mapreduce操作的mapper和reducer阶段相当于spark中的哪几个算子? 面试题04、Spark中的HashShufle的有哪些不足? 面试....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day23】——Spark10
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day22】——Spark9

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、Spark累加器有哪些特点? 面试题02、Spark hashParitioner的弊端是什么? 面试题 03、RangePartitioner分区的原理? 面试题04、rangePartioner分区器特点? 面试题05、如何理解Standalone模式下,Spark资源分配是粗粒度的?以下答案仅供参考:面试题 01、Sp....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day22】——Spark9
文章 2023-12-25 来自:开发者社区

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day21】——Spark8

停不要往下滑了,默默想5min,看看这5道面试题你都会吗?面试题 01、运行在yarn中Application有几种类型的container? 面试题02、Executor启动时,资源通过哪几个参数指定? 面试题 03、一个task的map数量由谁来决定? 面试题04、列出你所知道的调度器,说明其工作原理? 面试题05、导致Executor产生FULL gc 的原因,可能导致什么问题?以下答案仅....

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day21】——Spark8

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注