MQ之如何做到消息幂等

作者: duzhongli | 来源:发表于2017-09-20 11:45 被阅读2660次

    一、缘起

    MQ消息必达,架构上有两个核心设计点:

    (1)消息落地

    (2)消息超时、重传、确认

    再次回顾消息总线核心架构,它由

    发送端、服务端、固化存储、接收端

    四大部分组成。

    为保证消息的可达性,超时、重传、确认机制可能导致消息总线、或者业务方收到重复的消息,从而对业务产生影响。

    举个栗子:

    购买会员卡,上游支付系统负责给用户扣款,下游系统负责给用户发卡,通过MQ异步通知。不管是上半场的ACK丢失,导致MQ收到重复的消息,还是下半场ACK丢失,导致购卡系统收到重复的购卡通知,都可能出现,上游扣了一次钱,下游发了多张卡。

    消息总线的幂等性设计至关重要,是本文将要讨论的重点。

    二、上半场的幂等性设计

    MQ消息发送上半场,即上图中的1-3

    1,发送端MQ-client将消息发给服务端MQ-server

    2,服务端MQ-server将消息落地

    3,服务端MQ-server回ACK给发送端MQ-client

    如果3丢失,发送端MQ-client超时后会重发消息,可能导致服务端MQ-server收到重复消息。

    此时重发是MQ-client发起的,消息的处理是MQ-server,为了避免步骤2落地重复的消息,对每条消息,MQ系统内部必须生成一个inner-msg-id,作为去重和幂等的依据,这个内部消息ID的特性是:

    (1)全局唯一

    (2)MQ生成,具备业务无关性,对消息发送方和消息接收方屏蔽

    有了这个inner-msg-id,就能保证上半场重发,也只有1条消息落到MQ-server的DB中,实现上半场幂等。

    三、下半场的幂等性设计


    MQ消息发送下半场,即上图中的4-6

    4,服务端MQ-server将消息发给接收端MQ-client

    5,接收端MQ-client回ACK给服务端

    6,服务端MQ-server将落地消息删除

    需要强调的是,接收端MQ-client回ACK给服务端MQ-server,是消息消费业务方的主动调用行为,不能由MQ-client自动发起,因为MQ系统不知道消费方什么时候真正消费成功。

    如果5丢失,服务端MQ-server超时后会重发消息,可能导致MQ-client收到重复的消息。

    此时重发是MQ-server发起的,消息的处理是消息消费业务方,消息重发势必导致业务方重复消费(上例中的一次付款,重复发卡),为了保证业务幂等性,业务消息体中,必须有一个biz-id,作为去重和幂等的依据,这个业务ID的特性是:

    (1)对于同一个业务场景,全局唯一

    (2)由业务消息发送方生成,业务相关,对MQ透明

    (3)由业务消息消费方负责判重,以保证幂等

    最常见的业务ID有:支付ID,订单ID,帖子ID等。

    具体到支付购卡场景,发送方必须将支付ID放到消息体中,消费方必须对同一个支付ID进行判重,保证购卡的幂等。

    有了这个业务ID,才能够保证下半场消息消费业务方即使收到重复消息,也只有1条消息被消费,保证了幂等。

    三、总结

    MQ为了保证消息必达,消息上下半场均可能发送重复消息,如何保证消息的幂等性呢?

    上半场

    MQ-client生成inner-msg-id,保证上半场幂等。

    这个ID全局唯一,业务无关,由MQ保证。

    下半场

    业务发送方带入biz-id,业务接收方去重保证幂等。

    这个ID对单业务唯一,业务相关,对MQ透明。

    结论:幂等性,不仅对MQ有要求,对业务上下游也有要求。

    相关文章

      网友评论

      • 福海_865b:-----------引用开始------------------
        此时重发是MQ-client发起的,消息的处理是MQ-server,为了避免步骤2落地重复的消息,对每条消息,MQ系统内部必须生成一个inner-msg-id,作为去重和幂等的依据,这个内部消息ID的特性是:
        (1)全局唯一
        (2)MQ生成,具备业务无关性,对消息发送方和消息接收方屏蔽
        有了这个inner-msg-id,就能保证上半场重发,也只有1条消息落到MQ-server的DB中,实现上半场幂等。
        -----------引用结束------------------

        上面这句话,既然inner-msg-id是由MQ-client来生成的,那么第二点中为什么说inner-msg-id以于消息发送方是屏蔽的呢?
      • 小王同学加油:业务发送方带入biz-id,业务接收方去重保证幂等。 全局唯一 时间限制 等性能如何保证
      • a7eebbf7a302:疑惑:既上半场能保持消息不会重复,下半场为何不能用inner-msg-id来作为判重呢?
        事实上幂等都是用业务id来作为幂等校验的,说明inner-msg-id作为幂等,可能会存在不同inner-msg-id,消息体相同,是不是描述有错误呢?
      • xiangtan:幂等让MQ 处理还是不太合适,太重了

      本文标题:MQ之如何做到消息幂等

      本文链接:https://www.haomeiwen.com/subject/rransxtx.html