文章 2022-02-17 来自:开发者社区

Spark源码阅读的正确打开方式

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark 官网阅读笔记

1.spark读取本地文件系统: 则该文件也必须可以在工作节点上的相同路径上访问。所以需要将文件复制到所有work 节点或使用网络安装的共享文件系统。 2.group by key 没有reduceBykey, aggregateBykey高效,(后者是同时分区排序) 3.accumulator 累加器的使用 4.broadcast variables 广播变量的使用 5:Da...

文章 2022-02-17 来自:开发者社区

Spark RDD类源码阅读

每天进步一点点~开搞~ abstract class RDD[T: ClassTag]( //@transient 注解表示将字段标记为瞬态的 @transient private var _sc: SparkContext, // Seq是序列,元素有插入的先后顺序,可以有重复的元素。 @transient private var deps: Seq[Dependen...

文章 2022-02-17 来自:开发者社区

Spark常用函数(源码阅读六)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark数据传输及ShuffleClient(源码阅读五)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark之SQL解析(源码阅读十)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark BlockManager的通信及内存占用分析(源码阅读九)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark Job的提交与task本地化分析(源码阅读八)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark Shuffle数据处理过程与部分调优(源码阅读七)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

Spark Netty与Jetty (源码阅读十一)

  spark呢,对Netty API又做了一层封装,那么Netty是什么呢~是个鬼。它基于NIO的服务端客户端框架,具体不再说了,下面开始。   创建了一个线程工厂,生成的线程都给定一个前缀名。      像一般的netty框架一样,创建Netty的EventLoopGroup:      在常用的netty框架中呢,会创建客户端辅助类,设置SocketChannel: Bootstrap...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注