文章 2025-06-06 来自:开发者社区

Flink在B站的大规模云原生实践

摘要:本文整理自哔哩哔哩资深开发工程师丁国涛老师,在 Flink Forward Asia 2024 云原生专场的分享。内容分为以下五个部分: 1、 背景介绍 2、 功能及稳定性优化 3、 性能优化 4、 运维优化 5、 未来展望 01.背景介绍 1.1 云原生化的优势 在Flink建设初期,由于Flink与Hadoop结合比较好,所以采用Flink On YARN架构。但是Fli...

Flink在B站的大规模云原生实践
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(1)

作者:张杨 用户背景 哔哩哔哩是中国年轻一代的标志性品牌及领先的视频社区。网站创立于2009年6月,并于2010年1月正式命名为“哔哩哔哩”,提供全方位的视频内容以满足用户多元化的兴趣喜好,并且围绕着有文化追求的用户、高质量的内容、有才华的内容创作者以及他们之间的强大情感纽带,构建了bilibili的社区。 业务需求 B站围绕 Flink 主要做了三个方面的工作:平台建设、增量化和 AI on ....

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink  在 B 站的多元化探索与实践(1)
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(2)

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink  在 B 站的多元化探索与实践(1) https://developer.aliyun.com/article/12282312.增量化B站的增量化方案由Flink+Hudi构成,架构如上图所示。Flink计算引擎的 checkpoint 是一个天然的增量化机制,实时任务进行一次 che....

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink  在 B 站的多元化探索与实践(2)
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(3)

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink  在 B 站的多元化探索与实践(2) https://developer.aliyun.com/article/12282293. AI on Flink 传统的机器学习链路里数据的传输、特征的计算以及模型的训练,都是离线处理的,存在两个大的问题:第一个是时效性低,模型和特征的更新周期基....

《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink  在 B 站的多元化探索与实践(3)
文章 2022-04-08 来自:开发者社区

Flink 在 B 站的多元化探索与实践

摘要:本文整理自哔哩哔哩基础架构部资深研发工程师张杨在 Flink Forward Asia 2021 平台建设专场的演讲。主要内容包括:平台建设增量化AI On Flink点击查看直播回放 & 演讲PDF在过去的一年里,B 站围绕 Flink 主要做了三个方面的工作:平台建设、增量化和 AI on Flink。实时平台是实时业务的技术底座,也是 Flink 面向用户的窗口,需要坚持持续....

Flink 在 B 站的多元化探索与实践
文章 2022-02-17 来自:开发者社区

【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 b 站的应用

分享嘉宾:张杨,B 站资深开发工程师导读:整个机器学习的过程,从数据上报、到特征计算、到模型训练、再到线上部署、最终效果评估,整个流程非常冗长。在 b 站,多个团队都会搭建自己的机器学习链路,来完成各自的机器学习需求,工程效率和数据质量都难以保证。于是我们基于 Flink 社区的 aiflow 项目,构建了整套机器学习的标准工作流平台,加速机器学习流程构建,提升多个场景的数据实效和准确性。本次分....

【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 b 站的应用

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注