深入理解inode

作者: lwj_ow | 来源:发表于2017-09-19 16:51 被阅读755次

    看操作系统的时候看到一些关于文件的问题,上网搜顺便看到了关于讲解inode的博客,inode早在我看csapp的时候就接触到了,那个时候略有了解却不全面,如今看到博客总结了,我就精简一下并敲下来,顺便加上自己的一些理解.原文链接在这:深入理解inode

    1. inode是什么
      文件储存在硬盘上,硬盘上最小的储存单位叫做'扇区'(一个磁道上有很多扇区,一个柱面上有很多磁道,一个硬盘上有很多柱面),每个扇区储存512字节(不同硬盘可能不一定相同),相当于是0.5KB.

      操作系统在读取硬盘的时候,不会一个个扇区的读取,这样的效率太低,而是一次性连续读取多个扇区,即一次读取一个'块'.这种由多个扇区组成的块,就是文件存取的最小单元.块的大小,最常见的是4KB,即连续8个扇区组成一个block.(块的大小的取值也是有权衡的,太大导致内部碎片太多,太小的话导致读取效率低下)

      文件数据都储存在块中,那么显然我们还必须找到一个地方储存文件的元信息,比如文件的创建者,文件的创建日期,文件的大小等等很多信息.这种储存文件元信息的区域就叫inode,中文就是'索引节点'.

      每个文件都有对应的inode,里面包含了与该文件有关的一些信息.

    2. inode的内容
      inode包含文件的元信息,具体来说有以下内容(我上网查了一下POSIX标准,略加一些额外信息):

      • 文件的字节数
      • 设备ID(储存文件的设备ID)
      • 文件拥有者的User ID
      • 文件的Group ID
      • 文件的读,写,执行权限
      • 额外的系统和用户标志位:限制文件的使用和修改来保护文件
      • 文件的时间戳,共有三个:ctime指inode上一次变动的时间,mtime指文件内容上一次变动的时间,atime指文件上一次打开的时间.
      • 链接数:有多少文件名指向这个inode(硬连接)
      • 文件块指针:指向文件数据block的位置

      我们可以使用stat命令来查看某个文件的inode信息.

    stat sample.txt

    ![image.png](https://img.haomeiwen.com/i5550522/b331942c37b29390.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
    
    我简单解释一下图片上的东西,Blocks就是这个文件被储存在的块的编号.IO Blocks就是我们之前说的块的大小(即4KB).其他的看名字就能理解,我就不再赘述.
    
    值得一提的是,文件名并不在inode中,至于为什么没有文件名,下面我们会有解释.
    
    1. inode的大小
      inode当然也需要地方来储存,所以也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分为两个区域.一个是数据区,用来存放文件数据.另一个是inode区(inode table),存放inode.

      每个inode的大小在一个文件系统里面是固定的,一般是128字节或者是256字节.inode节点的总数,在格式化的时候就给定,一般是每1KB或者每2KB就设置一个inode.假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每一KB就设置一个inode,那么inode table的大小就会达到128MB,占整个硬盘的12.8%(实际上肯定是要小于这个数字的).

      查看每个硬盘分区的inode总和数和已经使用的数量,可以使用df命令.

    df -i

    ![image.png](https://img.haomeiwen.com/i5550522/9a24c832e084b03e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
    
    查看每个inode节点的大小,可以使用如下命令:(我使用的是tune2fs,另外后面的文件系统不同人可能不同)
    

    sudo tune2fs -h /dev/sdb1 | grep Inode

    ![image.png](https://img.haomeiwen.com/i5550522/a1e81cd8d00297ef.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
    
    简单解释一下,count显然就是inode的数量了,在更上面那张图片上也能得到确认.Inodes per group是指每组Inode的数量(ext4文件系统被分割成一系列由多个块组成的组,这是为了减少寻道时间而设计的),Inode blocks per group显然就是一个组里面储存inode的块的数量,inode的大小是256字节,我们做个简单的乘除:8192/512*256,这个的结果就是4096字节,也就是一个块的大小.
    
    1. inode号码
      每个inode都有个号码,操作系统用inode号码来识别不同的文件.

      这里值得重复强调一遍,类Unix系统内部是不使用文件名的,而是使用inode号码来识别文件,对于系统来说,文件名只是inode号码便于识别的别称或者绰号(有点类似于域名和IP地址的关系).

      表面上,用户通过文件名打开文件.实际上,在系统内部,这个过程分为三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在的block,读出数据.

      使用ls -i命令,可以看到文件名对应的inode号码

      image.png
    2. 目录文件
      Unix系统中,目录也是一种文件.打开目录,实际上就是打开目录文件.

      目录文件的结构很简单,就是一系列目录项(dirent)的列表.每个目录项,由两部分组成:所包含的文件的文件名,以及该文件名对应的inode号码.
      我们可以使用ls来列出目录文件中的所有文件名
      也可以使用ls -i命令列出目录文件下所有文件的文件名和inode号码.
      如果要查看文件的详细信息,就必须根据文件的inode号码,访问inode节点,读取相关信息.ls -l命令列出文件的详细信息.

      值得注意的是,目录文件的读权限(r)和写权限(w),都是针对目录文件本身,而不是针对目录下的文件.由于目录文件内只有文件名和inode号码,所以如果只有读权限,只能获取文件名,无法获取其他信息,因为其他信息都储存在inode节点中,而读取inode节点内的信息需要目录文件的执行权限(x).

    3. inode的特殊作用
      由于inode号码与文件名分离,这种机制导致了一些Unix/Linux系统特有的现象

      • 有时,文件名包含特殊字符,无法正常删除。这时,直接删除inode节点,就能起到删除文件的作用.(我们可以用unlink命令来删除一个文件)
      • 移动或者重命名文件,只是改变文件名,并不影响inode号码
      • 打开一个文件之后,系统就以inode号码来识别这个文件,不再考虑文件名.通常来说,系统无法从inode号码得知文件名.(实际上,unix系统用的是文件描述符来标识打开文件,但本质上我们可以通过文件描述符轻易找到文件的inode号码).
    4. 在这篇文章的后面,原博客博主还顺道介绍了硬连接和软连接,由于我在之前的博客已经进行比较过了,所以我就不在这里细说,想看看的童鞋可以去翻翻我之前的博客.(自夸一句,个人觉得那篇博客解释的还是不错的(笑)).

    结语:写到这里inode就介绍的差不多了,深入理解inode对我们理解unix的文件系统是非常有帮助的.我的个人博客是topping,大部分博客主要都发在个人网站上,欢迎去看看提出您宝贵的建议.

    相关文章

      网友评论

        本文标题:深入理解inode

        本文链接:https://www.haomeiwen.com/subject/uzgwsxtx.html