Kafka 入门

作者: xiaolyuh | 来源:发表于2020-09-27 16:19 被阅读0次

消息中间件基本架构

image.png

消息中间件基本上可以分为三部分：

Product 生产者，消息的产生方，生产者会将消息发送到消息队列。
queue 消息队列，接受并存储生产者的消息。
Consumer 消费者，消费消息队列中的消息。

消息中间件的作用

消息队列的主要作用削峰填谷、异步、解耦。

消费消息的两种模式

消息消费的两种模式，发布订阅模式和点对点模式：

发布订阅模式（一对多）

消费者消费完消息后，消息不会被删除，消息会存储一段时间，这种模式下的消息会被所有消费者消费。

这种模式下消费消息又有两种方式：

推模式，这种方式由queue直接将消息推给消费者，由于各消费者处理消息的能力不一样，所以这种方式某些消费者可能消费不过来推过来的消息。

image.png
拉模式，这种方式是由消费者去拉取queue中的消息，这种方式下消费者可以根据自己的消费能力来拉取数据，但是每个消费者需要维护一个拉取消息的任务，及时队列里面没有消息，这个任务也不能停下来。

image.png

点对点模式（一对一）：点对点模式是消费者主动拉取数据，消息确认被消费后，消息队列会删除队列中的消息，一条消息只会被一个消费者消费。

image.png

Kafka基本概念

Kafka是一个分布式的消息队列，使用Zookeeper进行集群的管理。

不同消费者组之间是基于发布/订阅的拉模式来实现的；同一消费者组里面的消费者，消费消息使用的是点对点模式，只是这里消费完消息后不会删除消息。

image.png

Kafka的特性

高吞吐量、低延迟：kafka每秒可以处理几十万条消息，它的延迟最低只有几毫秒，每个topic可以分多个partition, consumer group 对partition进行consume操作。
可扩展性：kafka集群支持热扩展。
持久性、可靠性：消息被持久化到本地磁盘，并且支持数据备份防止数据丢失。
容错性：允许集群中节点失败（若副本数量为n,则允许n-1个节点失败）。
高并发：支持数千个客户端同时读写。

Producer

消息生产者，就是向 kafka broker 发消息的客户端;

Broker

一台 kafka 服务器就是一个 broker。一个kafka集群由多个 broker 组成，然后通过Zookeeper来进行集群的管理。

Consumer

消息消费者，向 kafka broker 取消息的客户端;

Consumer Group

消费者组，由多个 consumer 组成。同一个消费者组中消费者只能消费一个分区里面的数据。

Topic

Topic是一个逻辑上的消息队列，同一类型的消息可以放到一个Topic（消息队列）中。主要作用是用来屏蔽底层分区和副本的复杂逻辑。

Partition

Partition（分区），是Kafka下数据存储的基本单元，这个是物理上的概念。一个 topic 可以分为多个 partition，每个 partition 都是一个有序的队列，同一个分区（partition）可以被不同的消费者组同时消费，但是同一个消费者组内只能被一个消费者消费，通过提升分区数量可以提升同一个Topic的吞吐量。

Replica

Replica（副本），就是Partition的一个备份。一个分区（Partition）只能有一个leader，但是可以设置多个副本（follower），同一分区的副本不能在同一台机器上。也就是说如果有2 台 Broker，那么一个分区就最多会有1个副本。leader的主要作用是：完成与生产者、消费者的交互；follower的主要作用是：做数据备份，当 leader 发生故障时，某个 follower 会成为新的 leader，以此来保证kafka的可用性。

分区中的所有副本统称为 AR，而ISR 是指与leader 副本保持同步状态的副本集合，当然leader副本本身也是这个集合中的一员。

LEO标识每个分区中最后一条消息的下一个位置，分区的每个副本都有自己的LEO，ISR中最小的LEO即为HW，俗称高水位，消费者只能拉取到HW之前的消息。

如果我们需要提升kafka消费性能的时候，我们需要同时扩充Partition（分区）数量和同一消费者组中的消费者数量。

我这里使用数据库设计中的分库分表设计来做一个类比：一个订单库，DB分为db_order_1、db_order_2，然后每个数据库中的t_order表有分为t_order_1、t_order_2表。这里db_order_1、db_order_2就相当于kafka的Broker；t_order_1、t_order_2就相当于kafka的Partition（分区）；t_order是一个逻辑表，就相当于kafka中的Topic；如果还有从库，那么从库中的t_order_1、t_order_2就相当于kafka的Replica（副本）。

代码示例

发送消息

@Resource
private KafkaTemplate<String, String> kafkaTemplate;

public <T> void plainNotify(String topic, T obj) {
    try {
        this.kafkaTemplate.send(topic, JSON.toJSONString(obj));
    } catch (Exception e) {
        // TODO
    }
}

消费消息

@Service
@Slf4j
public class Consumer {

    @KafkaListener(id = "ConsumerGroupId", topics = {"TOPIC1", "TOPIC2"})
    public void consumer(List<String> msgs, Acknowledgment ack) {
        for (String  msg : msgs) {
            // TODO
        }

        ack.acknowledge();
    }
}

网友评论

本文标题：Kafka 入门

本文链接：https://www.haomeiwen.com/subject/tjpkuktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Kafka 入门

消息中间件基本架构

消息中间件的作用

消费消息的两种模式

发布订阅模式（一对多）

Kafka基本概念

Kafka的特性

Producer

Broker

Consumer

Consumer Group

Topic

Partition

Replica

代码示例

发送消息

消费消息

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读