一、CDC扫盲
1,什么是Flink CDC
首先引入一个实际场景,假设有一个订单系统,数据需要应用到多种场景:
- 支持事务性操作(DB)
- 支持搜索(ES)
- 提高性能写入缓存(Redis)中
如果用双写方案,会存在一些问题:
1)业务逻辑复杂,不易扩展
2)性能问题
3)数据一致性问题(例如写入DB成功,写入ES失败)如果用分布式事务来保证数据一致性,会增加系统复杂度和延时

更优的一种方案是采用CDC

二、CDC同步
基于日志的话例如mysql的binlog日志

2.1 基于日志CDC的数据同步

参考
【1】基于 Flink SQL CDC 的实时数据同步方案:https://www.bilibili.com/video/BV1zt4y1D7kt?spm_id_from=333.999.0.0
网友评论