文章 2022-08-22 来自:开发者社区

Flink / Scala - DataSource 之 DataSet 获取数据总结

一.引言编辑数据源创建初始数据集,这里主要以 DataSet 数据源为例,例如从文件或者从 collection 中创建,后续介绍 DataStreaming 的数据源获取方法。创建数据集的机制一般抽象在 InputFormat 后面,这里有点类似 spark 的 sparkContext,Flink 的 ExecutionE...

Flink / Scala - DataSource 之 DataSet 获取数据总结
文章 2022-08-22 来自:开发者社区

Flink / Scala - DataSet Transformations 常用转换函数详解

一.引言上一篇文章讲到了 Flink 如何获取数据生成 DataSet,这篇文章主要讨论 DataSet 后续支持的 Transform 转换函数。相较于 Spark,Flink 提供了更多的 API 和更灵活的写法与实现。编辑 Tips :下述示例均以该 env 为基础实现import org.apache.flink.api.scala.ExecutionEnvi...

Flink / Scala - DataSet Transformations 常用转换函数详解
文章 2022-08-22 来自:开发者社区

Flink / Scala - DataSet & DataStream Sink 输出数据详解

 一.引言Flink 的数据处理主要分三步,第一步 Source 为数据源,分为 DataSet 和 DataStreaming ,后一步为 Transformation 负责处理和转换数据,针对不同的 DataSource,Transformation 可能会存在差异,最后一步是 sink 负责将结果输出。前面...

Flink / Scala - DataSet & DataStream Sink 输出数据详解

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注