看操作系统的时候看到一些关于文件的问题,上网搜顺便看到了关于讲解inode的博客,inode早在我看csapp的时候就接触到了,那个时候略有了解却不全面,如今看到博客总结了,我就精简一下并敲下来,顺便加上自己的一些理解.原文链接在这:深入理解inode
-
inode是什么
文件储存在硬盘上,硬盘上最小的储存单位叫做'扇区'(一个磁道上有很多扇区,一个柱面上有很多磁道,一个硬盘上有很多柱面),每个扇区储存512字节(不同硬盘可能不一定相同),相当于是0.5KB.操作系统在读取硬盘的时候,不会一个个扇区的读取,这样的效率太低,而是一次性连续读取多个扇区,即一次读取一个'块'.这种由多个扇区组成的块,就是文件存取的最小单元.块的大小,最常见的是4KB,即连续8个扇区组成一个block.(块的大小的取值也是有权衡的,太大导致内部碎片太多,太小的话导致读取效率低下)
文件数据都储存在块中,那么显然我们还必须找到一个地方储存文件的元信息,比如文件的创建者,文件的创建日期,文件的大小等等很多信息.这种储存文件元信息的区域就叫inode,中文就是'索引节点'.
每个文件都有对应的inode,里面包含了与该文件有关的一些信息.
-
inode的内容
inode包含文件的元信息,具体来说有以下内容(我上网查了一下POSIX标准,略加一些额外信息):- 文件的字节数
- 设备ID(储存文件的设备ID)
- 文件拥有者的User ID
- 文件的Group ID
- 文件的读,写,执行权限
- 额外的系统和用户标志位:限制文件的使用和修改来保护文件
- 文件的时间戳,共有三个:ctime指inode上一次变动的时间,mtime指文件内容上一次变动的时间,atime指文件上一次打开的时间.
- 链接数:有多少文件名指向这个inode(硬连接)
- 文件块指针:指向文件数据block的位置
我们可以使用stat命令来查看某个文件的inode信息.
stat sample.txt
![image.png](https://img.haomeiwen.com/i5550522/b331942c37b29390.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
我简单解释一下图片上的东西,Blocks就是这个文件被储存在的块的编号.IO Blocks就是我们之前说的块的大小(即4KB).其他的看名字就能理解,我就不再赘述.
值得一提的是,文件名并不在inode中,至于为什么没有文件名,下面我们会有解释.
-
inode的大小
inode当然也需要地方来储存,所以也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分为两个区域.一个是数据区,用来存放文件数据.另一个是inode区(inode table),存放inode.每个inode的大小在一个文件系统里面是固定的,一般是128字节或者是256字节.inode节点的总数,在格式化的时候就给定,一般是每1KB或者每2KB就设置一个inode.假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每一KB就设置一个inode,那么inode table的大小就会达到128MB,占整个硬盘的12.8%(实际上肯定是要小于这个数字的).
查看每个硬盘分区的inode总和数和已经使用的数量,可以使用df命令.
df -i
![image.png](https://img.haomeiwen.com/i5550522/9a24c832e084b03e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
查看每个inode节点的大小,可以使用如下命令:(我使用的是tune2fs,另外后面的文件系统不同人可能不同)
sudo tune2fs -h /dev/sdb1 | grep Inode
![image.png](https://img.haomeiwen.com/i5550522/a1e81cd8d00297ef.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
简单解释一下,count显然就是inode的数量了,在更上面那张图片上也能得到确认.Inodes per group是指每组Inode的数量(ext4文件系统被分割成一系列由多个块组成的组,这是为了减少寻道时间而设计的),Inode blocks per group显然就是一个组里面储存inode的块的数量,inode的大小是256字节,我们做个简单的乘除:8192/512*256,这个的结果就是4096字节,也就是一个块的大小.
-
inode号码
每个inode都有个号码,操作系统用inode号码来识别不同的文件.这里值得重复强调一遍,类Unix系统内部是不使用文件名的,而是使用inode号码来识别文件,对于系统来说,文件名只是inode号码便于识别的别称或者绰号(有点类似于域名和IP地址的关系).
表面上,用户通过文件名打开文件.实际上,在系统内部,这个过程分为三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在的block,读出数据.
使用ls -i命令,可以看到文件名对应的inode号码
image.png -
目录文件
Unix系统中,目录也是一种文件.打开目录,实际上就是打开目录文件.目录文件的结构很简单,就是一系列目录项(dirent)的列表.每个目录项,由两部分组成:所包含的文件的文件名,以及该文件名对应的inode号码.
我们可以使用ls来列出目录文件中的所有文件名
也可以使用ls -i命令列出目录文件下所有文件的文件名和inode号码.
如果要查看文件的详细信息,就必须根据文件的inode号码,访问inode节点,读取相关信息.ls -l命令列出文件的详细信息.值得注意的是,目录文件的读权限(r)和写权限(w),都是针对目录文件本身,而不是针对目录下的文件.由于目录文件内只有文件名和inode号码,所以如果只有读权限,只能获取文件名,无法获取其他信息,因为其他信息都储存在inode节点中,而读取inode节点内的信息需要目录文件的执行权限(x).
-
inode的特殊作用
由于inode号码与文件名分离,这种机制导致了一些Unix/Linux系统特有的现象- 有时,文件名包含特殊字符,无法正常删除。这时,直接删除inode节点,就能起到删除文件的作用.(我们可以用unlink命令来删除一个文件)
- 移动或者重命名文件,只是改变文件名,并不影响inode号码
- 打开一个文件之后,系统就以inode号码来识别这个文件,不再考虑文件名.通常来说,系统无法从inode号码得知文件名.(实际上,unix系统用的是文件描述符来标识打开文件,但本质上我们可以通过文件描述符轻易找到文件的inode号码).
-
在这篇文章的后面,原博客博主还顺道介绍了硬连接和软连接,由于我在之前的博客已经进行比较过了,所以我就不在这里细说,想看看的童鞋可以去翻翻我之前的博客.(自夸一句,个人觉得那篇博客解释的还是不错的(笑)).
网友评论