美文网首页人人都是产品经理
浅谈Kafka文件存储机制

浅谈Kafka文件存储机制

作者: Cristiano7_ckl | 来源:发表于2020-05-11 17:10 被阅读0次
topic 分区文件存储位置

kafka安装目录下有个data文件夹,我有个topic 起名叫first,并且有两个分区。图中first-0,和first-1 就是存储该topic 数据的地方,由于kafka是将数据存储在磁盘,为了提升读取效率,所以kafka也是采取了分片和索引的手段来提升数据查找读取效率

分区文件的索引文件与数据文件

随便cd 到某一个分区文件下,就会看到有.index和.log两个文件,顾名思义.index就是该分区下的索引文件,.log文件就是正儿八经存数据的文件了。index 和 log 文件以当前 segment(分片) 的第一条消息的 offset 命名。

kafka partition文件示意图

由于生产者生产的消息会不断追加到 log 文件末尾,为防止 log 文件过大导致数据定位

效率低下,Kafka 采取了分片和索引机制,将每个 partition 分为多个 segment。每个 segment

对应两个文件——“.index”文件和“.log”文件。这些文件位于一个文件夹下,该文件夹的命名

规则为:topic 名称+分区序号。例如,first 这个 topic 有三个分区,则其对应的文件夹为 first0,first-1,first-2。

index文件和log文件示意图

“.index”文件存储大量的索引信息,“.log”文件存储大量的数据,索引文件中的元数据指向对应数据文件中 message 的物理偏移地址。“3” 代表该分区下的第3条消息,“756”代表该条消息在所有分区中的偏移量,根据“756”这个偏移量去“.log”文件中查找 offset=3的消息。

这样说大概能理解kafka的文件存储流程了吗?

相关文章

  • 浅谈Kafka文件存储机制

    kafka安装目录下有个data文件夹,我有个topic 起名叫first,并且有两个分区。图中first-0,和...

  • Kafka - 存储和索引

    Kafka文件存储机制那些事 kafka分区、分段、稀疏索引实现高性能查询 kafka log文件格式

  • Kafka文件存储机制

    Kafka文件存储机制需要从以下4个步骤进行分析 (1) topic中partition存储分布(2) parti...

  • kafka文件存储机制

    一,kafka简介 Kafka最初由Linkedin公司开发的分布式、分区的、多副本的、多订阅者的消息系统。它...

  • Kafka文件存储机制

    笔记来源于尚硅谷视频课程 在server.properties文件中配置了log.dir属性,该目录存储日志文件 ...

  • 【kafka】kafka文件存储、删除机制

    课程分为四部分:主体技术讲解、外部系统集成、生产调优手册、源码解析。基于最新稳定版本Kafka3.x,加入最新的K...

  • kafka手记

    参考 Kafka文件存储机制那些事 kafka入门:简介、使用场景、设计原理、主要配置及集群搭建(转)zookee...

  • kafka文件存储机制------验证

    前言 本文是对Kafka文件存储机制那些事的简单验证 knowledge topic - partition每一个...

  • 2. 三天掌握kafka中章—kafka文件存储解密

    1. kafka文件存储机制   Kafka中发布订阅的对象是topic,我们可以为每类数据创建一个topic,P...

  • Kafka学习笔记(二)架构深入

    1. Kafka工作流程及文件存储机制 Kafka中消息是以topic进行分类的,生产者生产消息,消费者消费消息,...

网友评论

    本文标题:浅谈Kafka文件存储机制

    本文链接:https://www.haomeiwen.com/subject/zgaunhtx.html