美文网首页
Kafka Consumer Group和Consumer Re

Kafka Consumer Group和Consumer Re

作者: 伊凡的一天 | 来源:发表于2019-03-29 20:00 被阅读0次

    在新建一个Consumer时,我们可以通过指定groupId来将其添加进一个Consumer Group中。Consumer Group是为了实现多个Consumer能够并行的消费一个Topic,并且一个partition只能被一个Consumer Group里的一个固定的Consumer消费。

    Consumer Rebalance

    对于一个Consumer Group,可能随时都有Consumer加入或者退出这个Consumer Group,Consumer列表的变化势必会引起partition的重新分配。这个为Consumer分配partition的过程就被称为Consumer Rebalance。

    出现任何以下的场景都会触发Consumer Rebalance操作:

    • 有新的消费者加入Consumer Group。
    • 有消费者主动退出Consumer Group。
    • Consumer Group订阅的任何一个Topic出现分区数量的变化
    • ......

    默认情况下,Kafka提供了两种分配策略:Range和RoundRobin

    Range策略

    range策略的具体步骤如下:

    1. 对一个topic中的partition进行排序
    2. 对消费者按字典进行排序
    3. 然后遍历排序后的partition的方式分配给消费者

    举个例子,比如有两个消费者C0和C1,两个topic(t0,t1),每个topic有三个分区p(0-2),

    那么采用Range策略,分配出的结果为:

    • C0: [t0p0, t0p1, t1p0, t1p1]
    • C1: [t0p2, t1p2]

    RoundRobin策略

    RoundRobin策略和Range策略类型,唯一的区别就是Range策略分配partition时,是按照topic逐次划分的。而RoundRobin策略则是将所有topic的所有分区一起排序,然后遍历partition分配给消费者。

    因此,采用RoundRobin策略,分配出的结果为:

    • C0: [t0p0, t0p2, t1p1]
    • C1: [t0p1, t1p0, t1p2]

    Group Coordinator

    Group Coordinator是负责管理Consumer Group的组件。当一个Consumer希望加入某一个Consumer Group时,它会发送一个请求给Group Coordinator。Group Coordinator负责维护一个Consumer Group中所有的Consumer列表,随着Consumer的加入和退出,Coordinator也会随之更新这个列表。

    第一个加入Consumer Group的Consumer被称为leader。

    一旦Consumer Group中的成员发生变化,例如有新的Consumer加入,那么就需要为其分配partition;或者有Consumer退出,那么就需要将其负责消费的partition分配给组内其他成员。因此Consumer Group中的成员发生变化, Group Coordinator就负责发起Consumer Rebalance活动。

    值得注意的是,真正的Consumer Rebalance行为是由Consumer Group Leader执行的。Group Leader首先向Coordinator获取Group中的Consumer成员列表,然后根据Rebalance策略,将partition分配给Consumer Group中的成员,再将分配结果告知Coordinator。最后,Coordinator将partition分配结果通知给每一个Consumer。在Consumer Rebalance的过程中,所有的Consumer都不允许消费消息。

    Producer发送消息到Topic时,分配partition的算法如下:

    1. 如果指定了一个partition,那么直接使用指定的partition
    2. 如果没有指定partition,但是指定了key,那么会根据key进行哈希,分配到对应的partition中
    3. 如果partition和key都没指定,会使用round-robin算法进行分配

    总结

    1. Consumer Groups 用于多个Consumer并行消费消息。为了防止两个消费者重复消费一条消息,Kafka不允许同一个Consumer Group中的两个Consumer读取同一个partition。
    2. Group Coordinator 用于维护Consumer Group信息。
    3. Consumer Rebalance 是为Consumer Group中的Consumer分配partition的过程。一旦一个Consumer Group中的成员发生变化,就会触发Rebalance行为。
    4. Group leader 是第一个加入Consumer Group的Consumer,它负责Consumer Rebalance的执行。
    5. Consumer Rebalance策略主要有Range和Round Robin。

    参考文章

    相关文章

      网友评论

          本文标题:Kafka Consumer Group和Consumer Re

          本文链接:https://www.haomeiwen.com/subject/lvvrbqtx.html