文章 2024-10-14 来自:开发者社区

大数据-89 Spark 集群 RDD 编程-高阶 编写代码、RDD依赖关系、RDD持久化/缓存

点一下关注吧!!!非常感谢!!持续更新!!!目前已经更新到了:Hadoop(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume&...

大数据-89 Spark 集群 RDD 编程-高阶 编写代码、RDD依赖关系、RDD持久化/缓存
阿里云文档 2024-07-11

多引擎Spark-2.x依赖的配置及示例

本文为您介绍Spark-2.x依赖的配置以及Spark-2.x示例说明。

文章 2024-03-04 来自:开发者社区

Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存

RDD依赖关系 查看血缘关系 RDD只支持粗粒度转换,每一个转换操作都是对上游RDD的元素执行函数f得到一个新的RDD,所以RDD之间就会形成类似流水线的前后依赖关系。 将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数据丢失时,它可以根据这些信息来重新运算丢失的RDD的...

Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存
阿里云文档 2023-09-03

Spark-1.x依赖的配置以及Spark-1.x相关示例_云原生大数据计算服务 MaxCompute(MaxCompute)

本文为您介绍Spark-1.x依赖的配置以及Spark-1.x相关示例。

文章 2023-08-04 来自:开发者社区

Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(二)

4、RDD持久化4.1 RDD Cache缓存1、RDD Cache缓存(1)RDD通过Cache或者persist方法将前面的计算结果缓存(2)默认情况下会把数据以序列化的形式缓存在JVM的堆内存中。(3)但是并不是这个两个方法被调用时立即缓存,而是触发后面的action算子时,该RDD将会被缓存在计算节点的内存中,并供后面重用。2、创建包名com.zhm.spark.operator.cac....

Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(二)
文章 2023-08-04 来自:开发者社区

Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(一)

1、WordCount案例实操导入项目依赖<dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.12</artifactId> <versi...

Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(一)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注