阿里云文档 2025-09-19

本文介绍了使用Flink、EMR Serverless Spark和Paimon构建流批一体数据湖分析的完整流程,包括数据写入、交互查询及Compact操作。

本文演示了使用实时计算Flink版和EMR Serverless Spark构建Paimon数据湖分析流程。该流程包括将数据写入OSS、进行交互式查询以及执行离线数据Compact操作。EMR Serverless Spark完全兼容Paimon,通过内置的DLF元数据与其他云产品(例如,实时计算Flink版)实现元数据互通,形成完整的流批一体化解决方案。它支持灵活的任务运行方式和参数配置,满足实...

问答 2024-07-29 来自:开发者社区

为什么选择从Kafka + Spark Streaming转向Flink?

为什么选择从Kafka + Spark Streaming转向Flink?

问答 2023-06-29 来自:开发者社区

DataWorks实时计算只能用EMR Spark Streaming节点吗?有没有flink sq

DataWorks实时计算只能用EMR Spark Streaming节点吗?有没有flink sql

问答 2022-06-13 来自:开发者社区

当把仅有确定性计算的 Spark Streaming 和 Flink 进行对比时二者的不同点有哪些?

当把仅有确定性计算的 Spark Streaming 和 Flink 进行对比时二者的不同点有哪些?

文章 2022-06-13 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2

五、现有流处理框架介绍5.1 StormStorm是最老的流媒体框架,技术成熟可靠。社区也很活跃。ali还开发了jstorm,对storm进行了拓展完善。后续jstorm也融入到storm中,对于storm也是一个质的提升。比较适合于基于事件的一些简单用例场景。优点:极低的延迟,真正的流媒体,成熟和高吞吐量非常适合非复杂的流媒体用例缺点:不支持状态管理没有事件时间处理,聚合,窗口,会话,水印等高....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2
文章 2022-06-13 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1

文章目录一、前言二、什么是流式处理三、流式处理的重点有哪些3.1 交付保障3.2 故障容错3.3 状态管理3.4 性能3.5 成熟四、流式处理的两种类型4.1 Native流4.2 小批量处理4.3 两种类型都有一些优点和缺点五、现有流处理框架介绍5.1 Storm5.2 Spark Streaming5.3 Flink5.4 Kafka Steams5.5 Kafka Streams vs. ....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1
文章 2022-06-13 来自:开发者社区

Spark Streaming,Flink,Storm,Kafka Streams,Samza:如何选择流处理框架

如今,有许多可用的开源流框架。有趣的是,几乎所有它们都是相当新的,仅在最近几年才开发出来。因此,对于新手来说,很容易混淆流框架之间的理解和区分。在本文中,我将首先大致讨论流处理的类型和方面,然后比较最受欢迎的开源流框架:Flink,SparkStreaming,Storm,KafkaStream。我将尝试(简要地)解释它们的工作原理,它们的用例,优势,局限性,异同。什么是流/流处理:流处理的最优....

Spark Streaming,Flink,Storm,Kafka Streams,Samza:如何选择流处理框架
文章 2022-02-17 来自:开发者社区

从 Spark Streaming 到 Apache Flink:bilibili 实时平台的架构与实践

摘要:本文由 bilibili 大数据实时平台负责人郑志升分享,基于对 bilibili 实时计算的痛点分析,详细介绍了 bilibili Saber 实时计算平台架构与实践。本次分享主要围绕以下四个方面: 一、实时计算的痛点 二、Saber 的平台演进 三、结合 AI 的案例实践 四、未来的发展与思考 重要:点击「PPT」可下载 Flink Forward Asia 大会全部PP...

文章 2022-02-17 来自:开发者社区

从 Spark Streaming 到 Apache Flink : 实时数据流在爱奇艺的演进

作者:陈越晨 整理:刘河 本文将为大家介绍Apache Flink在爱奇艺的生产与实践过程。你可以借此了解到爱奇艺引入Apache Flink的背景与挑战,以及平台构建化流程。主要内容如下: 爱奇艺在实时计算方面的的演化和遇到的一些挑战 爱奇艺使用Flink的User Case 爱奇艺Flink平台化构建流程 爱奇艺在Flink上的改进 未来工作 爱奇艺简介 爱奇艺在2010年正式上线...

文章 2022-02-16 来自:开发者社区

Spark Streaming和Flink的Word Count对比

准备: nccat for windows/linux 都可以 通过 TCP 套接字连接,从流数据中创建了一个 Spark DStream/ Flink DataSream, 然后进行处理, 时间窗口大小为10s 因为 示例需要, 所以 需要下载一个netcat, 来构造流的输入。 代码: spark streaming package cn.kee.spark; public...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注