Kafka 消费积压百万数据方案

Kafka 消费积压百万数据方案

作者: 雪飘千里 | 来源:发表于2023-04-27 20:26 被阅读0次

ClickHouse生产问题处理（一）如何去更新字段类型
python3读写kafka
Kafka的消费积压监控-Burrow
优雅的使用Kafka Consumer
Kafka实际案例问题
Kafka_核心
Kafka0.8集群部署与shell命令行操作
kafka集群搭建
Kafka消息积压
Spark kafka + streaming自适应topic

一、背景

某一天下午业务高峰期，突然收到系统告警，kafka对应的topic消息出现大量积压，且kafka消费速率和写入速率无明显变化，

5分钟内主题平均每分钟写入速率如下:当前 419718，昨天 366523，对比昨天增长14.51%
5分钟内平均每分钟消费速率如下:当前 348716，昨天70522，对此昨天降低589%，当前积压 1252965，消费速率已低于写入速率，积压量持续增长

二、问题排查

从这个告警消息可以看出，我们xx模块消费kafka对应的topic消息出现大量积压，导致消息积压的原因：

1、生产消息过快
2、消费速率过慢

一般我们可以检查消费端日志，是否有大量报错，另外通过监控系统的dump文件，查看耗时比较久的线程，有针对性优化代码：比如上面的报警后面发现，采用hutool组件的JSONUtil.toLst()方法，这个方法在高并发下性能非常差。

三、解决方案

消费端:
1. 优先扩节点（应急处理）
  
  如果应用消费节点小于 kafka partiton分区数，可以扩应用消费节点，否则，扩应用消费节点没用；
  
  例如:dance-member-service应用节点: 24个，broker分区数: 16，扩应用节点是否有用?—— 答案: 没用 dance-member-service应用节点: 12个，broker分区数: 16，扩应用节点是否有用? ——答案:有用，扩4个节点，消费能力明显增强
2. 优化消费端代码自动提交改为手动提交；单条消费消息改为批量消费消息，数据单条入库改为批量入库；消费逻辑涉及DB操作，第一时间检查是否有慢SQL（MySQL Explain详解）；
  
  系统不能快速扩容的话，采用动态开关降级，不入库或者不做业务处理，直接快速消费；
broker端:

优先扩节点（应急处理）

如果kafka partition分区数小于应用消费节点，可以扩broker分区数，否则，扩broker分区数没用；

例如:dance-member-service应用节点: 12个，broker分区数: 16，扩broker分区数是否有用? ——答案: 没用

dance-member-service应用节点: 24个，broker分区数: 16，扩broker分区数是否有用?—— 答案:有用，有8个应用节点处于空闲状态，扩8个节点，消费能力明显增强
生产端:
1. 系统不能快速扩容的话，针对生产端采用动态配置开关降级，关闭MQ生产；
2. 消费端消息没有积压后，通过消息补偿机制对业务消息补偿，同时消费端需要支持幂等
四、节假日大促相关预案

双十一大促或者节假日做活动抢购，这个时候生产端的消息一定会大大增加，很容易就会消息积压。我们平时要做好链路压测，尽可能优化消费端代码，提高消费速率。同时准备大促前的相关预案:
- 支持动态扩容
- 配置开关动态关闭生成端
- 配置开关动态关闭消费端
- 生成端支持消息补偿
- 消费端支持消息幂等

相关文章

ClickHouse生产问题处理（一）如何去更新字段类型
背景监控发现生产环境kafka的一个topic消费积压：问题排查我们是通过kafka引擎表将数据入到clic...
python3读写kafka
消费kafka数据，方式一消费kafka数据，方式二将消息写入kafka
Kafka的消费积压监控-Burrow
使用kafka, 消费生产的数据是必不可少的, 为不影响业务的正常处理, 对消费过程的积压lag的监控和报警就显得...
优雅的使用Kafka Consumer
如何消费数据我们已经知道了如何发送数据到Kafka,既然有数据发送,那么肯定就有数据消费,消费者也是Kafka整...
Kafka实际案例问题
kafka consumer防止数据丢失 Kafka学习之怎么保证不丢，不重复消费数据 1 消费者pull数据时，...
Kafka_核心
kafka集群 Kafka的设计都是为了实现kafak消息队列消费数据的语义Kafka消息队列中数据消费的三种语义...
Kafka0.8集群部署与shell命令行操作
1、kafka简介在流式计算中，Kafka一般用来缓存数据，Storm通过消费Kafka的数据进行计算。KAFKA...
kafka集群搭建
1、kafka简介在流式计算中，Kafka一般用来缓存数据，Storm通过消费Kafka的数据进行计算。KAFKA...
Kafka消息积压
STAR情景：CrateDB节点崩溃，重启后，分片需要进行复制；Kafka消息的消费组消息积压，消费者无法注册到T...
Spark kafka + streaming自适应topic
背景 spark streaming + kafka 有两种方案接收kafka数据-基于receiver的方案和d...

网友评论

本文标题：Kafka 消费积压百万数据方案

本文链接：https://www.haomeiwen.com/subject/akkijdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Kafka 消费积压百万数据方案|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！