文章 2022-11-27 来自:开发者社区

spark/Flink 导入导出starrocks

Flink导入数据到starrocks支持的数据源CSVJSON操作步骤步骤一:添加 pom 依赖<dependency> <groupId>com.starrocks</groupId> <artifactId>flink-connector-starrocks</artifactId> <!-- for...

spark/Flink 导入导出starrocks
文章 2022-09-22 来自:开发者社区

Kafka/Spark/Flink Exactly-once语义调研

前言Exactly-once投递语义是分布式系统中最常遇到的话题,Exactly-once保证了哪怕系统发生故障,每一个 ETL 操作也仅会被执行一次,不会产生数据的丢失或者重复。这是数据投递的最强保证,很难实现这个等级的流处理数据投递。接下来是对于一些业界主流的Exactly-once投递语义的调研。本文主要关注的是方案的实现和技术点,重点在于方案的failover机制和高可用,对于分布式系统....

Kafka/Spark/Flink Exactly-once语义调研
问答 2022-06-13 来自:开发者社区

当把仅有确定性计算的 Spark Streaming 和 Flink 进行对比时二者的不同点有哪些?

当把仅有确定性计算的 Spark Streaming 和 Flink 进行对比时二者的不同点有哪些?

文章 2022-06-13 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2

五、现有流处理框架介绍5.1 StormStorm是最老的流媒体框架,技术成熟可靠。社区也很活跃。ali还开发了jstorm,对storm进行了拓展完善。后续jstorm也融入到storm中,对于storm也是一个质的提升。比较适合于基于事件的一些简单用例场景。优点:极低的延迟,真正的流媒体,成熟和高吞吐量非常适合非复杂的流媒体用例缺点:不支持状态管理没有事件时间处理,聚合,窗口,会话,水印等高....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2
文章 2022-06-13 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1

文章目录一、前言二、什么是流式处理三、流式处理的重点有哪些3.1 交付保障3.2 故障容错3.3 状态管理3.4 性能3.5 成熟四、流式处理的两种类型4.1 Native流4.2 小批量处理4.3 两种类型都有一些优点和缺点五、现有流处理框架介绍5.1 Storm5.2 Spark Streaming5.3 Flink5.4 Kafka Steams5.5 Kafka Streams vs. ....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1
文章 2022-06-13 来自:开发者社区

Spark Streaming,Flink,Storm,Kafka Streams,Samza:如何选择流处理框架

如今,有许多可用的开源流框架。有趣的是,几乎所有它们都是相当新的,仅在最近几年才开发出来。因此,对于新手来说,很容易混淆流框架之间的理解和区分。在本文中,我将首先大致讨论流处理的类型和方面,然后比较最受欢迎的开源流框架:Flink,SparkStreaming,Storm,KafkaStream。我将尝试(简要地)解释它们的工作原理,它们的用例,优势,局限性,异同。什么是流/流处理:流处理的最优....

Spark Streaming,Flink,Storm,Kafka Streams,Samza:如何选择流处理框架
问答 2022-04-02 来自:开发者社区

Spark和Flink差异有哪些?

如题

文章 2022-02-17 来自:开发者社区

从 Spark 做批处理到 Flink 做流批一体

本⽂由社区志愿者苗文婷整理,内容来源⾃ LinkedIn 大数据高级开发工程师张晨娅在 Flink Forward Asia 2020 分享的《从 Spark 做批处理到 Flink 做流批一体》,分享的主题是如何从 Spark 做批处理到 Flink 做流批一体,在 LinkedIn 的一些探索实践经验。主要内容为:为什么要做流批一体?当前行业已有的解决方案和现状,优势和劣势探索生产实践场景的....

从 Spark 做批处理到 Flink 做流批一体
文章 2022-02-17 来自:开发者社区

工作3年,月薪20k+的大数据开发人员,突然说我不想只做Hadoop、Spark、Flink层面的技术开发

“不管国内或全球“新冠”疫情有多严重、还得持续多久,我只想先保住我的工作,如果降薪,我也能在短时间找到待遇更好的下一个东家”。 ——《大数据就业特训营》23期学员李斌 2014年做大数据培训至今,已有5年之多,可以说大数据技术的发展变化速度之快,用“突飞猛进”来说毫不夸张。就单从计算引擎领域的发展来说,2014年之前,想必都还在使用MapReduce来做离线计算,速度虽然慢,但能处理TB级...

工作3年,月薪20k+的大数据开发人员,突然说我不想只做Hadoop、Spark、Flink层面的技术开发
文章 2022-02-17 来自:开发者社区

【观察】常用的流式框架(二)-- Spark与Flink

Spark由加州大学伯克利分校于2009年开发,第二年开源,2014年成为Apache顶级项目。作为MapReduce的继任者,Spark可以提供高水准API(如RDD--可恢复分布式数据集;Dstream--离散无序的RDD),其社区在2015年就有超过1000名贡献者,知名的用户包括亚马逊、eBay、雅虎、IBM、百度等。 2013年Spark Streaming成为Spark的核心...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注