问答 2023-06-29 来自:开发者社区

Flink CDC 中刚才了解到现网有个单表2.2数据量的,在数据初始化全量同步时候?

问题1:Flink CDC 中刚才了解到现网有个单表2.2数据量的,在数据初始化全量同步时候flinkcdc支持按主键分组并行抽取吗求解答大佬? 问题2:那如果单表数据量像这种非常大的情况咋处理呢

问答 2023-06-29 来自:开发者社区

Flink CDC中做全量数据表同步时候,滑动窗口设置时长设置多大呢?5s可以么?4000w数据?

Flink CDC中做全量数据表同步时候,滑动窗口设置时长设置多大呢?5s可以么?4000w数据?

高性能

Flink CDC 实现企业级实时数据同步

传统的数据集成通常由全量和增量同步两套系统构成,在全量同步完成后,还需要进一步将增量表和全量表进行合并操作,这种架构的组件构成较为复杂,系统维护困难。本方案提供 Flink CDC 技术实现了统一的增量和全量数据的实时集成。
技术解决方案背景图
问答 2023-06-29 来自:开发者社区

Flink CDC这个后台系统是官方的?当前设置的窗口是10s,测试的同步40w数据平均耗时2分20

Flink CDC这个后台系统是官方的? 当前设置的窗口是10s,测试的同步40w数据平均耗时2分20秒,感觉有点太慢了 。。 es设置的每秒写入100mb数据或者每秒2w条数据,现在每一批提交的数据差不多在60mb的样子,40w是模拟的增量,真实数据在4600w的样子,都是往小了测,实际的话单日增量数据在100~300w之间,这个还只是模拟了单表的全量同步,没测多流join场景;以及反查数据库....

问答 2023-06-29 来自:开发者社区

咨询一个Flink CDC问题,为现在有一个实时同步任务,如果为需要增加几个表进去同步。是不是要先?

咨询一个Flink CDC问题,为现在有一个实时同步任务,如果为需要增加几个表进去同步。是不是要先启动一个新任务,把这几个新增表 先全量同步过去,然后再老任务里面 加上这几个表之后,重savepoint 重启任务就行?

问答 2023-06-18 来自:开发者社区

请问下,Flink CDC中使用flink sql 的当时做同步没有问题,但是使用流api进行同?

请问下,Flink CDC中使用flink sql 的当时做同步没有问题,但是使用流api进行同步的时候出现 Caused by: com.ververica.cdc.connectors.shaded.com.zaxxer.hikari.pool.HikariPool$PoolInitializationException: Failed to initialize pool: Acces...

问答 2023-06-18 来自:开发者社区

Flink CDC 中这个是从Oracle读出来,下面同步到另一个Oracle怎么弄啊,刚学习?

Flink CDC 中这个是从Oracle读出来,下面同步到另一个Oracle怎么弄啊,oracle->oracle,刚学习flink?

问答 2023-06-18 来自:开发者社区

flink cdc 同步 mongo 的数据到hudi,大概2亿多条数据,目前发现同步历史数据的时?

flink cdc 同步 mongo 的数据到hudi,大概2亿多条数据,目前发现同步历史数据的时候,状态特别大,都100G+了,比source端接收的数据量还大,而且我还做了按天分区的。有人知道啥原因吗?

问答 2023-06-18 来自:开发者社区

Flink CDC读表数据后写kafka,消费者消费后写es;用bulk往es同步时速率较慢导致数?

Flink CDC读表数据后写kafka,消费者消费后写es;用bulk往es同步时速率较慢导致数据积压,这个有好点的解决办法么?我是这么批量往es写的 设置的同步提交,不会再存到缓存里,需要做一些处理再往es写,直接用连接器没法实现,我一会来看下,应该也是可以的,水位线那个是啥意思,不支持配置吗?

问答 2023-06-18 来自:开发者社区

有遇到Flink CDC这个没得?有人晓得pg 的solt 数量和同步的数据库是什么关系吗?

有遇到Flink CDC这个没得?有人晓得pg 的solt 数量和同步的数据库是什么关系吗? 我应该配置多少个slot

问答 2023-06-18 来自:开发者社区

Flink CDC中还有我要同步多个数据,pg配置文件那个插槽数量需要配置多少呢?pg 13.5 都

Flink CDC中还有我要同步多个数据,pg配置文件那个插槽数量需要配置多少呢?pg 13.5 都没得这个参数了

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注