文章 2024-11-14 来自:开发者社区

【赵渝强老师】Spark Streaming中的DStream

要开发Spark Streaming应用程序,核心是通过StreamingContext创建DStream。因此DStream对象就是Spark Streaming中最核心的对象。DStream的全称是Discretized Stream,翻译成中文是离散流。它是Spark Streaming对流式数据的基本数据抽象,或者说是Spark Streaming的数据模型。DStream的核心是通过时....

【赵渝强老师】Spark Streaming中的DStream
文章 2024-10-14 来自:开发者社区

大数据-102 Spark Streaming Kafka ReceiveApproach DirectApproach 附带Producer、DStream代码案例

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-102 Spark Streaming Kafka ReceiveApproach DirectApproach 附带Producer、DStream代码案例
文章 2024-10-14 来自:开发者社区

大数据-101 Spark Streaming DStream转换 窗口操作状态 跟踪操作 附带多个案例(一)

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-101 Spark Streaming DStream转换 窗口操作状态 跟踪操作 附带多个案例(一)
文章 2024-10-14 来自:开发者社区

大数据-101 Spark Streaming DStream转换 窗口操作状态 跟踪操作 附带多个案例(二)

接上篇:https://developer.aliyun.com/article/1622641?spm=a2c6h.13148508.setting.19.27ab4f0ehhuqRu [窗口操作] 案例3 热点搜索词实时统计 编写代码 package icu.wzk ...

大数据-101 Spark Streaming DStream转换 窗口操作状态 跟踪操作 附带多个案例(二)
文章 2024-10-14 来自:开发者社区

大数据-100 Spark 集群 Spark Streaming DStream转换 黑名单过滤的三种实现方式(一)

喜大普奔!破百了! 点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) K...

大数据-100 Spark 集群 Spark Streaming DStream转换 黑名单过滤的三种实现方式(一)
文章 2024-10-14 来自:开发者社区

大数据-100 Spark 集群 Spark Streaming DStream转换 黑名单过滤的三种实现方式(二)

接上篇:https://developer.aliyun.com/article/1622638?spm=a2c6h.13148508.setting.21.27ab4f0ehhuqRu 方案1 外连接实现 package icu.wzk import org.apache.s...

大数据-100 Spark 集群 Spark Streaming DStream转换 黑名单过滤的三种实现方式(二)
文章 2024-10-14 来自:开发者社区

大数据-99 Spark 集群 Spark Streaming DStream 文件数据流、Socket、RDD队列流

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-99 Spark 集群 Spark Streaming DStream 文件数据流、Socket、RDD队列流
文章 2024-01-19 来自:开发者社区

Spark Streaming的DStream与窗口操作

实时数据处理已经成为当今大数据时代的一个重要领域,而Spark Streaming是Apache Spark生态系统中的一个关键模块,用于处理实时数据流。本文将深入探讨Spark Streaming中的DStream(离散流)概念以及如何使用窗口操作来处理实时数据。 什么是DStream? DStream是Spark Streaming的核心抽象,它代表了连续的数据流,可以从各种数据源创建,...

Spark Streaming的DStream与窗口操作
文章 2023-12-20 来自:开发者社区

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)

流数据和流计算在大数据时代,数据可以分为静态数据和流数据,静态数据是指在很长一段时间内不会变化,一般不随运行而变化的数据。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域但是,在大数据时代,不仅数据格式复杂、来源众多,而且数据量巨大,这就对实时计算提出了很大的挑战。因此....

【大数据技术】流数据、流计算、Spark Streaming、DStream的讲解(图文解释 超详细)
文章 2022-06-11 来自:开发者社区

【Spark Streaming】(三)DStream 算子详解

文章目录一、前言二、Transformations on DStreams三、 Window Operations(窗口操作)四、Output Operations on DStreams(输出操作)一、前言Spark Streaming是核心Spark API的扩展,它支持对实时数据流进行可伸缩、高吞吐量和容错的流处理。数据可以从Kafka、Flume、Kinesis或TCP套接字等多个源获取....

【Spark Streaming】(三)DStream 算子详解

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注