文章 2024-11-06 来自:开发者社区

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

摘要:本文整理自阿里云智能集团研究员、开源大数据平台负责人王峰(莫问)老师在云栖大会的开源大数据专场上的分享。主要有以下几个内容: Apache Flink 已经成为业界流计算事实标准Flash 向量化流计算引擎核心技术解读Flash 性能测试数据Flash在阿里集团的落地效果 今天给大家带来的分享是阿里云的开源大数据团队在实时计算领域最...

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之将 Flink 的容错与云原生的弹性扩缩容相结合要怎么操作

问题一:容错在 Flink 中为什么重要? 容错在 Flink 中为什么重要? 参考回答: 容错是 Flink 流计算的关键路径,它保证了在发生故障时能够迅速恢复作业,减少数据丢失,保证数据处理的连续性和准确性。 关于本问题的更多回答可点击原文查看: https://developer.aliyun.com/ask/67118...

文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之Flink 通过 Key Group 管理状态是怎么操作的

问题一:为什么状态重新分配的时间远大于从远端存储读取状态数据的时间? 为什么状态重新分配的时间远大于从远端存储读取状态数据的时间? 参考回答: 状态重新分配涉及将状态数据根据新的并行度切分并分配到各个算子,这一过程比简单的数据读取更复杂,且需要确保数据的一致性和连续性,因此耗时较长。 ...

Flink 新一代流计算和容错问题之Flink 通过 Key Group 管理状态是怎么操作的
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之如何实现 Generalized Log-Based Incremental Checkpoint

问题一:Generalized Log-Based Incremental Checkpoint 是如何实现的? Generalized Log-Based Incremental Checkpoint 是如何实现的? 参考回答: Generalized Log-Based Incremental Checkpoint 通过将有状态的算子的状态更新同时...

文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之在有状态的算子中,状态更新是怎么记录的

问题一:Buffer Debloating 如何帮助 Unaligned Checkpoint? Buffer Debloating 如何帮助 Unaligned Checkpoint? 参考回答: Buffer Debloating 通过减少中间流动的数据量,使得 Unaligned Checkpoint 在做快照时需要额外存储的中间数据也变少,从而...

Flink 新一代流计算和容错问题之在有状态的算子中,状态更新是怎么记录的
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之 Flink 作业的 local buffer pool 的 size 要如何估算

问题一:Flink 哪个版本开始支持 Unaligned Checkpoint? Flink 哪个版本开始支持 Unaligned Checkpoint? 参考回答: Flink 从 1.11 版本开始支持 Unaligned Checkpoint。 ...

Flink 新一代流计算和容错问题之 Flink 作业的 local buffer pool 的 size 要如何估算
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之中间数据流动缓慢导致 Checkpoint 慢的问题要如何解决

问题一:Checkpoint Barrier 在 Flink 中是如何流动的? Checkpoint Barrier 在 Flink 中是如何流动的? 参考回答: Checkpoint Barrier 会随着中间数据处理向下游流动,流过算子时,系统会给算子的当前状态做同步快照,并将快照数据异步上传到远端存储。 关于本问题的更多回答可点...

Flink 新一代流计算和容错问题之中间数据流动缓慢导致 Checkpoint 慢的问题要如何解决
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之Flink 通过云原生技术改进容错设计要如何操作

问题一:Fault Tolerance 2.0 主要解决什么问题? Fault Tolerance 2.0 主要解决什么问题? 参考回答: Fault Tolerance 2.0 主要解决 Flink 在容错恢复过程中的效率问题,特别是在对延迟性、稳定性和一致性有高要求的场景下,如风控安全。 关于本问题的更多回答可点击原文查看: ...

Flink 新一代流计算和容错问题之Flink 通过云原生技术改进容错设计要如何操作
文章 2024-08-26 来自:开发者社区

Flink 新一代流计算和容错问题之Flink 中的数据可以分为什么类型

问题一:Flink 在正常处理下的延迟大约是多少? Flink 在正常处理下的延迟大约是多少? 参考回答: 在正常处理的情况下,Flink 引擎框架本身除了定期去做 Checkpoint 的快照,几乎没有其他额外的开销,而且 Checkpoint 快照很大一部分是异步的,所以 Flink 的端到端延迟大约在 100 毫秒左右。 关于本...

问答 2024-07-29 来自:开发者社区

Flink 极致流计算的关键点是什么?

Flink 极致流计算的关键点是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

+关注