文章 2024-08-26 来自:开发者社区

美团 Flink 大作业部署问题之Checkpoint Replicate Service 跨 HDFS 集群的副本制作是如何实现的

问题一:为什么使用 distcp 跨机房复制 Checkpoint 不是一个好的选择? 为什么使用 distcp 跨机房复制 Checkpoint 不是一个好的选择? 参考回答: 使用 distcp 跨机房复制 Checkpoint 不是一个好的选择,因为 distcp 会为每个复制任务启动一个重的 mapreduce 作业,而 Checkpoint ...

美团 Flink 大作业部署问题之Checkpoint Replicate Service 跨 HDFS 集群的副本制作是如何实现的
问答 2024-07-30 来自:开发者社区

Checkpoint Replicate Service 是如何实现跨 HDFS 集群的副本制作的?

Checkpoint Replicate Service 是如何实现跨 HDFS 集群的副本制作的?

问答 2024-02-14 来自:开发者社区

Flink有没有遇到过打checkpoint的时候,遇到写hdfs的错误然后一直卡死,怎么回事?

Flink有没有遇到过打checkpoint的时候,遇到写hdfs的错误然后一直卡死?状态非常大的时候,而且重启初始化非常的慢

问答 2023-07-25 来自:开发者社区

Flink里打包好的jar包上传运行,checkpoint在代码里可以设置oss-hdfs的地址么?

Flink里打包好的 jar 包上传运行,checkpoint 在代码里可以设置到 oss-hdfs 的地址么?

问答 2023-04-12 来自:开发者社区

问一下大佬们,我们最近flink任务从checkpoint(hdfs存储)恢复,发现恢复信息里还尝试

问一下大佬们,我们最近flink任务从checkpoint(hdfs存储)恢复,发现恢复信息里还尝试连接旧的hdfs(我们换了hdfs,把任务的checkpoint相关文件迁移到新的hdfs了),这样的问题遇到过么?或者checkpoint会存储集群的hdfs地址么?

问答 2023-04-10 来自:开发者社区

问一下群里的大佬们,我们最近flink任务从checkpoint(hdfs存储)恢复,发现恢复信息里

问一下群里的大佬们,我们最近flink任务从checkpoint(hdfs存储)恢复,发现恢复信息里还尝试连接旧的hdfs(我们换了hdfs,把任务的checkpoint相关文件迁移到新的hdfs了),这样的问题遇到过么?或者checkpoint会存储集群的hdfs地址么?

问答 2023-01-27 来自:开发者社区

请问一下,flink checkpoint 的hdfs 路径,有台机器磁盘坏了了,导致flink任务

请问一下,flink checkpoint 的hdfs 路径,有台机器磁盘坏了了,导致flink任务失败,这种问题集群感知到了,yarn有告警提示,后面我通知运维手动隔离了那台机器,请问有自动隔离的办法吗?这样的话任务应该不会失败了

问答 2022-12-27 来自:开发者社区

从之前的checkpoint恢复运行,之后的checkpoint上传到hdfs的数据(300M)

从之前的checkpoint恢复运行,之后的checkpoint上传到hdfs的数据(300M)比之前checkpoint上传的数据量(1.5g)少,按理说我是全量checkpoint,不应该出现这种情况吧?

问答 2022-10-24 来自:开发者社区

flink将checkpoint写入到hdfs中七天之后token过期,有大佬解决过这个问题吗?

flink将checkpoint写入到hdfs中七天之后token过期,有大佬解决过这个问题吗?

问答 2021-12-24 来自:开发者社区

背景:配置Flink的高可用,想将checkpoint存放在hdfs上面,rpc 过长的错误。

测试机需要配置Flink的HA,需要将checkpoint存放在hdfs上,发现Flink集群无法启动,出现了rpc 过长的错误,但是发现Flink在未启动成功jobmanage和taskmanage后,将checkpoint存放在了HDFS上,我并没有hadoop的权限,测试集群也没有hadoop相关的配置 请问有什么建议?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云存储

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

+关注