1 面试题
如何保证消息的顺序性?
2 考点分析
MQ必问话题
不仅能考察你是否了解关心过顺序性
还能考察你是否有方法保证消息的顺序
3 详解
3.1 案例
比如一个 mysql binlog
同步系统,日同步数据要达到上亿,也就是说数据从一个 MySQL节点原封不动地同步到另一个 MySQL节点(MySQL -> MySQL)。
常见的比如大数据团队,就需要同步完整的一个 MySQL 节点,对公司的业务系统的数据做各种复杂的操作。
你在 MySQL 里增删改一条数据,对应增删改 3 条 binlog
日志,接着这三条 binlog
发送到 MQ ,再消费出来依次执行,保证按照顺序是不是就很重要呢?
3.2 错乱场景
3.2.1 RabbitMQ
一个 queue,多个 consumer。
比如,生产者向 RabbitMQ 发送了三个数据,依次为 data1-2-3,压入的是 RabbitMQ 的一个内存队列。有三个消费者分别从 MQ 中消费这三条数据中的一条,结果消费者2先执行完操作,把 data2 存入数据库,然后是 data1/data3。这不明显乱了。
![](https://img.haomeiwen.com/i16782311/7e9d8f372f9f2d0b.png)
-
Kafka:比如说我们建了一个 topic,有三个 partition。生产者在写的时候,其实可以指定一个 key,比如说我们指定了某个订单 id 作为 key,那么这个订单相关的数据,一定会被分发到同一个 partition 中去,而且这个 partition 中的数据一定是有顺序的。
消费者从 partition 中取出来数据的时候,也一定是有顺序的。到这里,顺序还是 ok 的,没有错乱。接着,我们在消费者里可能会搞多个线程来并发处理消息。因为如果消费者是单线程消费处理,而处理比较耗时的话,比如处理一条消息耗时几十 ms,那么 1 秒钟只能处理几十条消息,这吞吐量太低了。而多个线程并发跑的话,顺序可能就乱掉了。
[图片上传失败...(image-3e64e3-1559751150662)]
解决方案
RabbitMQ
拆分多个 queue,每个 queue 一个 consumer,就是多一些 queue 而已,确实是麻烦点;或者就一个 queue 但是对应一个 consumer,然后这个 consumer 内部用内存队列做排队,然后分发给底层不同的 worker 来处理。
[图片上传失败...(image-b07ac9-1559751150662)]
Kafka
- 一个 topic,一个 partition,一个 consumer,内部单线程消费,单线程吞吐量太低,一般不会用这个。
- 写 N 个内存 queue,具有相同 key 的数据都到同一个内存 queue;然后对于 N 个线程,每个线程分别消费一个内存 queue 即可,这样就能保证顺序性。
[图片上传失败...(image-274521-1559751150662)]
举个例子,一个mysql binlog同步系统,压力还是非常大的,日同步数据要达到上亿.
mysql -> mysql,常见的一点在于说大数据team,就需要同步一个mysql库过来,对公司的业务系统的数据做各种复杂的操作。
你在mysql里增删改一条数据,对应出来了增删改3条binlog,接着这三条binlog发送到MQ里面,到消费出来依次执行,起码得保证人家是按照顺序来的吧?
不然本来是:增加、修改、删除;
你楞是换了顺序给执行成删除、修改、增加
不全错了么!
本来这个数据同步过来,应该最后这个数据被删除了;结果你搞错了这个顺序,最后这个数据保留下来了,数据同步就出错了。
先看看顺序会错乱的俩场景
- rabbitmq
一个queue,多个consumer,这不明显乱了 - kafka
一个topic,一个partition,一个consumer,内部多线程,这不也明显乱了
那如何保证消息的顺序性呢?简单简单
![](https://img.haomeiwen.com/i16782311/03f49d8039f3582d.png)
![](https://img.haomeiwen.com/i16782311/874cbbe6cbd9ae92.png)
![](https://img.haomeiwen.com/i16782311/a1eccd0be63cf317.png)
-
rabbitmq
拆分多个queue,每个queue一个consumer,就是多一些queue而已,确实是麻烦点
或者就一个queue但是对应一个consumer,然后这个consumer内部用内存队列做排队,然后分发给底层不同的worker来处理 -
kafka
一个topic,一个partition,一个consumer,内部单线程消费,写N个内存queue,然后N个线程分别消费一个内存queue即可
X 交流学习
![](https://img.haomeiwen.com/i16782311/14a776346f077539.jpg)
网友评论