文章 2017-05-02 来自:开发者社区

《深入理解Spark:核心思想与源码分析》——2.4节Spark基本架构

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第2章,第2.4节Spark基本架构,作者耿嘉安,更多章节内容可以访问云栖社区“华章社区”公众号查看 2.4 Spark基本架构从集群部署的角度来看,Spark集群由以下部分组成:Cluster Manager:Spark的集群管理器,主要负责资源的分配与管理。集群管理器分配的资源属于一级分配,它将各个Worker上的内存、C....

文章 2017-05-02 来自:开发者社区

深入理解Spark:核心思想与源码分析. 3.15 小结

3.15 小结 回顾本章, Scala与Akka的基于Actor的并发编程模型给人的印象深刻。listenerBus对于监听器模式的经典应用看来并不复杂,希望读者朋友能应用到自己的产品开发中去。此外,使用Netty所提供的异步网络框架构建的Block传输服务,基于Jetty构建的内嵌web服务(HTTP文件服务器和SparkUI),基于codahale提供的第三方测量仓库创建的测量系统,Exec....

文章 2017-05-02 来自:开发者社区

《深入理解Spark:核心思想与源码分析》——2.3节Spark基本设计思想

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第2章,第2.3节Spark基本设计思想,作者耿嘉安,更多章节内容可以访问云栖社区“华章社区”公众号查看 2.3 Spark基本设计思想2.3.1 Spark模块设计整个Spark主要由以下模块组成:Spark Core:Spark的核心功能实现,包括:SparkContext的初始化(Driver Application通过....

文章 2017-05-02 来自:开发者社区

深入理解Spark:核心思想与源码分析. 3.13 创建DAGSchedulerSource和BlockManagerSource

3.13 创建DAGSchedulerSource和BlockManagerSource 在创建DAGSchedulerSource、BlockManagerSource之前首先调用taskScheduler的post-StartHook方法,其目的是为了等待backend就绪,见代码清单3-53。postStartHook的实现见代码清单3-54。 创建DAGSchedulerSource和B....

文章 2017-05-02 来自:开发者社区

《深入理解Spark:核心思想与源码分析》——2.2节Spark基础知识

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第2章,第2.2节Spark基础知识,作者耿嘉安,更多章节内容可以访问云栖社区“华章社区”公众号查看 2.2 Spark基础知识1.版本变迁经过4年多的发展,Spark目前的版本是1.4.1。我们简单看看它的版本发展过程。1)Spark诞生于UCBerkeley的AMP实验室(2009)。2)Spark正式对外开源(2010年....

文章 2017-05-02 来自:开发者社区

深入理解Spark:核心思想与源码分析. 3.12 Spark环境更新

3.12 Spark环境更新 在SparkContext的初始化过程中,可能对其环境造成影响,所以需要更新环境,代码如下。 postEnvironmentUpdate() postApplicationStart() SparkContext初始化过程中,如果设置了spark.jars属性, spark.jars指定的jar包将由addJar方法加入httpFileServer的jarDir变量....

文章 2017-05-02 来自:开发者社区

深入理解Spark:核心思想与源码分析. 3.11 ContextCleaner的创建与启动

3.11 ContextCleaner的创建与启动 ContextCleaner用于清理那些超出应用范围的RDD、ShuffleDependency和Broadcast对象。由于配置属性spark.cleaner.referenceTracking默认是true,所以会构造并启动ContextCleaner,代码如下。 private[spark] val cleaner: Option[Con....

文章 2017-05-02 来自:开发者社区

深入理解Spark:核心思想与源码分析. 3.10 创建和启动ExecutorAllocationManager

3.10 创建和启动ExecutorAllocationManager ExecutorAllocationManager用于对已分配的Executor进行管理,创建和启动Executor-AllocationManager的代码如下。 private[spark] val executorAllocationManager: Option[ExecutorAllocationManager] ....

文章 2017-05-02 来自:开发者社区

《深入理解Spark:核心思想与源码分析》——第2章Spark设计理念与基本架构

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第2章Spark设计理念与基本架构,作者耿嘉安,更多章节内容可以访问云栖社区“华章社区”公众号查看 第2章Spark设计理念与基本架构若夫乘天地之正,而御六气之辩,以游无穷者,彼且恶乎待哉?—《庄子·逍遥游》本章导读上一章,介绍了Spark环境的搭建,为方便读者学习Spark做好准备。本章首先从Spark产生的背景开始,介绍S....

文章 2017-05-02 来自:开发者社区

《深入理解Spark:核心思想与源码分析》——1.5节小结

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第1章,第1.5节小结,作者耿嘉安,更多章节内容可以访问云栖社区“华章社区”公众号查看 1.5 小结本章通过引导大家在Linux操作系统下搭建基本的执行环境,并且介绍spark-shell等脚本的执行,来帮助读者由浅入深地进行Spark源码的学习。由于目前多数开发工作都在Windows系统下进行,并且Eclipse有最广大的用....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注