[帮助文档] 通过SparkStreaming作业处理Kafka数据

本文介绍在阿里云E-MapReduce创建的包含kafka服务的DataFlow集群中,如何使用Spark Streaming作业从Kafka中实时消费数据。

[帮助文档] 如何创建EMRSparkStreaming节点并进行数据开发_大数据开发治理平台 DataWorks(DataWorks)

EMR Spark Streaming节点用于处理高吞吐量的实时流数据,并具备容错机制,可以帮助您快速恢复出错的数据流。本文为您介绍如何创建EMR Spark Streaming节点并进行数据开发。

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第四阶段

19 课时 |
106 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第五阶段

32 课时 |
125 人已学 |
免费

大数据实战项目 - 反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第六阶段

21 课时 |
180 人已学 |
免费
开发者课程背景图
【Spark Streaming】(三)DStream 算子详解

【Spark Streaming】(三)DStream 算子详解

文章目录一、前言二、Transformations on DStreams三、 Window Operations(窗口操作)四、Output Operations on DStreams(输出操作)一、前言Spark Streaming是核心Spark API的扩展,它支持对实时数据流进行可伸缩、...

Spark Streaming之Transform算子详解

Transform算子解读:transform操作,应用在DStream上时,可以用于执行任意的RDD到RDD的转换操作。它可以用于实现, DStream API中所没有提供的操作。比如说,DStream API中,并没有提供将一个DStream中的每个 batch,与一个特定的RDD进行join的...

Spark Streaming之UpdateStateByKey算子详解

流处理中,有个状态(state)的概念:无状态的:当前批次处理完之后,数据只与当前批次有关有状态的:前后批次的数据处理完之后,之间是有关系的updateStateByKey解读updateStateByKey:返回的是一个新的并且带有状态的DStream,会...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4458+人已加入
加入
相关电子书
更多
云HBaseSQL及分析 ——Phoenix&Spark
Spark Streaming At Bing Scale
From Spark Streaming to Struct
立即下载 立即下载 立即下载

apache sparkstreaming相关内容