文章 2023-12-20 来自:开发者社区

【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)

DStream编程批处理引擎Spark Core把输入的数据按照一定的时间片(如1s)分成一段一段的数据,每一段数据都会转换成RDD输入到Spark Core中,然后将DStream操作转换为RDD算子的相关操作,即转换操作、窗口操作以及输出操作。RDD算子操作产生的中间结果数据会保存在内存中,也可以将中间的结果数据输出到外部存储系统中进行保存。转换操作1:无状态转换操作无状态转化操作每个批次的....

【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
文章 2022-02-16 来自:开发者社区

Spark 编程实战之经典算法TOP K

地址和最近、更新、最频繁的微博等应用场景。 本文转自 ChinaUnicom110 51CTO博客,原文链接: http://blog.51cto.com/xingyue2011/1949780

文章 2022-02-16 来自:开发者社区

Spark RDD/Core 编程 API入门系列之动手实战和调试Spark文件操作、动手实战操作搜狗日志文件、搜狗日志文件深入实战(二)

1、动手实战和调试Spark文件操作     这里,我以指定executor-memory参数的方式,启动spark-shell。   启动hadoop集群 spark@SparkSingleNode:/usr/local/hadoop/hadoop-2.6.0$ jps 8457 Jps spark@SparkSingleNode:/usr/local/hadoop/hado...

Spark RDD/Core 编程 API入门系列之动手实战和调试Spark文件操作、动手实战操作搜狗日志文件、搜狗日志文件深入实战(二)
文章 2022-02-16 来自:开发者社区

Spark RDD/Core 编程 API入门系列 之rdd实战(rdd基本操作实战及transformation和action流程图)(源码)(三)

本博文的主要内容是: 1、rdd基本操作实战 2、transformation和action流程图 3、典型的transformation和action       RDD有3种操作: 1、  Trandformation      对数据状态的转换,即所谓算子的转换 2、  Action ...

Spark RDD/Core 编程 API入门系列 之rdd实战(rdd基本操作实战及transformation和action流程图)(源码)(三)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注