Flink Kafka重复消费

作者: 淡淡的小番茄 | 来源:发表于2021-05-15 10:46 被阅读0次

Flink Kafka重复消费
Flink和kafka
Flink实现Kafka到Mysql的Exactly-Once
彻底搞懂 Flink Kafka OffsetState 存
Flink消费Kafka
Flink kafka source源码解析(四)
Flink 单并行度内使用多线程来提高任务的整体性能
Flink 消费 kafka 时如何处理空闲 task
kafka重复消费
Flink消费kafka（动态拉取topic + 正则匹配多个t

项目中使用了Flink平台实现了规则引擎功能，主要包括：数据转发和场景联动。其间多job问题一直困扰着我们，目前也没有一个完美的方案。

说一千道一万，总结为一句话：管理平台的规则执行状态与Flink平台job执行状态的一致性保证。

目前采取的方案是：前后端异步提交+Flink Job固定线程池提交+失败错误日志。

这两天也把之前的遇到的Flink多job重复消费问题，重拾起来，准备定位一把。因为我们多job的分组名称设置的是一样的。理论上是不应该重复消费kafka的消息的。但是，我们使用Flink自带的FlinkKafkaConsumer来消费，当存在多job的时候，确实是重复消费了。所以你懂的，熟悉的味道。我们Flink版本使用的是1.11.2版本，先梳理下相关的类图：