问答 2018-12-13 来自:开发者社区

Flink:Jobmanager UI中设置的并行性如何与任务槽相关?

假设我有8个任务管理器,有16个任务槽。如果我使用Jobmanager UI提交作业并将并行度设置为8,那么我是否只使用8个任务槽?如果我有8个任务管理器有8个插槽,并以8的并行度提交相同的作业怎么办?这是完全一样的吗?或者处理数据的方式有区别吗?

问答 2018-12-11 来自:开发者社区

Flink - 如何在多个任务槽中聚合和查询富接收器功能状态

我实现了一个rich sink函数,它根据调用的对象执行一些网络调用。我希望能够计算这些事件的一些元数据,这些事件由事件中包含的某些上下文信息(事件的batchID)键入,并将此元数据公开给外部系统。例如,事件如下所示:case class MyEvent(batchId: String, eventId: String, moreInformation: ...)class MySink(......

问答 2018-12-10 来自:开发者社区

了解Flink - 任务不可序列化

我正在研究一个Flink项目,并遇到了一个问题,我在Stackoverflow的帮助下设法解决了这个问题。但是,我不清楚为什么提出的解决方案实际可行,我发现有关该主题的信息很少。请考虑以下代码: object DeCP { def main(args: Array[String]): Unit = { val params: ParameterTool = ParameterTool.from.....

问答 2018-11-29 来自:开发者社区

[Flink]单机上运行多个flink任务,想看下或者监控下此时的一些性能指标,请问有什么方便的方法没

请教下:1、在单机上运行flink任务,想看下或者监控下此时的一些性能指标,请问有什么方便的方法或者工具没? 看到官方文档上,metric的采集,没有相关例子,不大明白怎么采集、report、显示出来?2、1.6版本上,在单机上启动Flink,也是用start-cluster.sh吧?之前的start-local.sh是不是去掉了? 3、单机上运行的话,相关启动参数是否需要修改,比如yaml文件....

问答 2018-11-28 来自:开发者社区

Apache Flink:如何使用SourceFunction以指定的时间间隔执行任务?

"我需要我的flink作业以指定的时间间隔从数据库中提取记录并在处理后将其归档。我已经实现了SourceFunction来从数据库中获取所需的记录,并添加了SourceFunction作为StreamExecutionEnvironment的源。如何指定StreamExecutionEnvironment需要每隔10分钟使用SourceFunction从数据库中获取记录? SourceFunct....

问答 2018-11-23 来自:开发者社区

各位大佬,flink state mapstate 保存数据100g 采用rocksdb增量更新 job 任务运行一段时间就死了。磁盘采用非ssd 。对于large state value 任务 有什么好的建议。

各位大佬,flink state mapstate 保存数据100g 采用rocksdb增量更新 job 任务运行一段时间就死了。磁盘采用非ssd 。对于large state value 任务 有什么好的建议。

问答 2018-11-22 来自:开发者社区

Flink提交任务到yarn-cluster模式时,flink list执行超时,获取不到JobManager信息。定位到问题原因与HA有关,有没有哪位大神遇到过类似问题

Flink提交任务到yarn-cluster模式时,flink list执行超时,获取不到JobManager信息。定位到问题原因与HA有关,有没有哪位大神遇到过类似问题

问答 2018-10-10 来自:开发者社区

在yarn上,起了flink session,再向session提交了任务,早上发现任务task没有了,failed有1的标记,请问下怎么查看这个出错的日志

本问题转自钉钉群21789141:请教个问题,在yarn上,起了flink session,再向session提交了任务,早上发现任务task没有了,failed有1的标记,请问下怎么查看这个出错的日志

文章 2017-11-21 来自:开发者社区

Flink流处理之迭代任务

前面我们分析过Flink对迭代在流图中的特殊处理,使得迭代中的反馈环得以转化为普通的DAG模型。这一篇我们将剖析运行时的流处理迭代任务的执行机制。这里涉及到两个任务类: StreamIterationHead:迭代头任务,它借助于反馈阻塞队列从迭代尾部接收参与下一次迭代的反馈数据。 StreamIterationTail:迭代尾任务,它借助于阻塞队列作为反馈信道将下一次需要迭代的数据反馈给...

文章 2017-11-21 来自:开发者社区

Flink运行时之合久必分的特定任务

合久必分的特定任务 前面我们谈到了TaskManager对每个Task实例会启动一个独立的线程来执行。在分析线程执行的核心代码时,我们看到最终执行的是AbstractInvokable这样执行体的invoke方法。所谓合久必分,鉴于流处理任务跟批处理任务执行模式上存在巨大的差异,在对AbstractInvokable的实现时,它们将会走向两个不同的分支。 流处理相关的任务 流处理所对应的任务的.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注