美文网首页
Pulsar Consumer redeliver 实现逻辑

Pulsar Consumer redeliver 实现逻辑

作者: wolf4j | 来源:发表于2019-07-12 20:59 被阅读0次

    Consumer redeliver

    在 consumer 中,redeliver的逻辑触发主要有两种形式,第一种是通过用户在创建consumer时,指定 acktimeout 的时间,一种是手动调用consumer端暴漏给用户的 redeliver 接口。

    Consumer UnackTracker

    在当前版本(2.3.2)中,consumer UnackTracker 只在 Sharedkey_Shared 这两种订阅模型中使用。因为经过 UnackTracker 之后,消息的顺序是没办法被保证的。目前,ExclusiveFailover 这两种订阅模型是没有 UnackTracker 的逻辑,当 ackTimeout 到达之后,broker 会找到当前没有被 unack 的那个消息的位置,将消息重新给发送过来。在 Sharedkey_Shared 这两种订阅模型下,对于没有 ack 的消息,会将他们 tracker 到一个集合(例如:set)中,当达到了用户设置的 ack timeout 之后,被tracker 的消息如果还没有被 ack ,会将整个 tracker 的消息,重新 redeliver 给当前的 consumer。

    在触发 redeliver 的逻辑时,需要使用到 CommandRedeliverUnacknowledgedMessages,告诉 broker 可以 redeliver 消息过来,proto文件定义如下:

    message CommandRedeliverUnacknowledgedMessages {
        required uint64 consumer_id = 1;
        repeated MessageIdData message_ids = 2;
    }
    

    CommandRedeliverUnacknowledgedMessages 包含两个字段,一个是 consumer_id 表示需要将消息重新发送给哪个 consumer,一个是 message_ids,表示需要发送哪些消息到当前的 consumer 中。需要进一步说明的是,MessageIdData 有四个字段构成,在这里比较主要的是在多 partition 的情况下,需要根据其中的 partition_id 进一步来确定,哪些 messages 是属于当前 partition 的 consumer。

    源码实现

    最直接的,用来与 client 端交互的是在 serverCnx 下的 handleRedeliverUnacknowledged 这个函数,如下:

        protected void handleRedeliverUnacknowledged(CommandRedeliverUnacknowledgedMessages redeliver) {
            // 判断当前的连接状态
            checkArgument(state == State.Connected);
            if (log.isDebugEnabled()) {
                log.debug("[{}] Received Resend Command from consumer {} ", remoteAddress, redeliver.getConsumerId());
            }
    
            // 获取consumer_id
            CompletableFuture<Consumer> consumerFuture = consumers.get(redeliver.getConsumerId());
    
            if (consumerFuture != null && consumerFuture.isDone() && !consumerFuture.isCompletedExceptionally()) {
                Consumer consumer = consumerFuture.getNow(null);
                // Subscription.isIndividualAckMode() 这个函数用来判断当前 consumer 订阅的类型是否是 Shared 或者 KeyShared。
                if (redeliver.getMessageIdsCount() > 0 && Subscription.isIndividualAckMode(consumer.subType())) {
                    consumer.redeliverUnacknowledgedMessages(redeliver.getMessageIdsList());
                } else {
                    // 如果订阅类型为 Exclusive 或者 Failover,执行下面 redeliver 的逻辑
                    consumer.redeliverUnacknowledgedMessages();
                }
            }
        }
    

    下面我们来看一下 redeliverUnacknowledgedMessages 的逻辑。

    message

    redeliverUnacknowledgedMessages 有两个接口,一个是有参数的,一个没有参数,他们之间的主要区别在于:

    当有参数的时候,redeliver的messages是从consumer端的unackMessageTracker中传入进来的,当没有参数的时候,redeliver的messages是从broker端的pendingAck中获取到的。

    总结:

    redeliver的逻辑需要按照不同的订阅类型来讲述,主要分为如下两种:

    • Exclusive and Filover
      • 这种逻辑相对比较简单,因为他是需要保证顺序的,所以每次redeliver就从当前没有被unack的那个位置点开始将消息发送给client端,具体消息是否被ack取决于client端是否将该条消息的ACK 命令发送给broker端
    • Shared and key_shared
      • 这种逻辑相对比较复杂,因为他是无序的状态,所以我需要去tracker每一条消息。
      • 所以在broker端有一个pendingAck的集合,当消息从producer端发送到broker中的ledger中之后,会有一个线程异步的去将ledger中的消息读取到pendingAck的集合中,这个时候ledger中的cursor位置会跟着向前移动,这个是broker端的逻辑。
      • 在client端,在consumer中会有一个unackmessageTracker的集合,至于这个集合什么时间开始tracker每一条消息,需要明白一个逻辑,一条消息被成功接收总共分为两步,第一步:receive;第二步:ack。unackmessageTracker所关心的消息是那些被consumer成功receiver到但是没有被ack的消息。当acktimeout到期之后,如果消息还没有被ack的就会去redeliver这部分被tracker的数据。在一个多partition的topic中,有好几个consumer,每一个consumer都有自己对应的一个unackmessageTracker的set集合,所以,他们就类似与pendingAck的子集。这些tracker的消息正常情况下一定会在pendingAck的集合中被找到。
      • unacktracker中有一个time的触发器,触发的时间就是acktimeout设定的时间。
      • redeliver messages 有两种形式,第一种,你可以将自己本地的tracker的消息发送给broker,broker会去给你redeliver相应的消息。第二种,发送一个空的redeliver命令上去,此时,broker会将pendingACK中所有的消息全部给你redeliver到consumer。

    相关文章

      网友评论

          本文标题:Pulsar Consumer redeliver 实现逻辑

          本文链接:https://www.haomeiwen.com/subject/jrdmfctx.html