逻辑结构
所有的数据都被逻辑的存放在一个空间中,称之为表空间。表空间又由段(Segment)=>区(Extent)=>页(Page)组成。逻辑存储结构大致如下图
data:image/s3,"s3://crabby-images/e9888/e98887c3506aad86d2ea0d1dbcac4eeb054392a4" alt=""
逻辑结构在IBD文件中如何描述
表空间下一级称为Segment。Segment与数据库中的索引相映射。Innodb引擎内,每个索引(包括聚簇索引)对应两个Segment:管理叶子节点的Segment和管理非叶子节点的segment。Innodb内部使用Inode来描述segment(存于Inode页中的,IBD中第一个Inode页为IBD文件的第三个页)。
Segment的下一级是Extent,Extent代表一组连续的page,默认为64个page,大小1MB。Extent的作用是提高page分配效率,批量分配在效率上总是优于离散、单一的Page分配,另外在数据连续性方面也更佳,Innodb内部使用XDES来描述Extent(存于Extent Descriptor页中,第一个Extent Descriptor为IDB文件的第一个页)。
Page则是表空间数据存储的基本单位。
IBD概览图如下,第一个Page中存放了Filespace Header和Extent Descriptor,第三个Page中存放了Inode。
data:image/s3,"s3://crabby-images/12a78/12a78ad76b5b146645f135df0a1788dd1394c32d" alt=""
站在一个索引的角度来看,结构如下图,一个Index有2个Segment,这两个Segment信息存在于这个Index 的root Page中,即Page 3中,描述这两个Segment的Inode存放在Page2中,Inode中包含Frag Array(指向每个Segment初始的32个Page)以及一些链表,如Full List,Not Full List,Free List,链表元素指向Page 0中的Xdes或后面的Xdes(由于单个Edes page只能描述256个extent,因此,每隔256个Extent(16384个page)便需要一个Xdes page)。Xdes中的页存放这个Index具体的数据。
data:image/s3,"s3://crabby-images/e866a/e866a84f31afb7f21fab4488b7b09f68e6aa6ed7" alt=""
元数据页
FSP_HDR PAGE
数据文件的第一个Page类型为FIL_PAGE_TYPE_FSP_HDR,在创建一个新的表空间时进行初始化(fsp_header_init),该Page除了页的常规头部和尾部外,包括FSP HEADER和256个Xdes。如下图
data:image/s3,"s3://crabby-images/f0140/f0140c91e4bce974f0ac513db165e878e2a5438e" alt=""
FSP HEADER中包含文件的基本元信息,通过FREE、FREE_FRAG等LIST管理着整个IBD文件的Extent,通过FULL_INDES、FREE_INODES等LIST管理着整个IBD文件的Inode页,如下图
data:image/s3,"s3://crabby-images/af262/af262e7a617541e0776fe740f26c984390efd0eb" alt=""
data:image/s3,"s3://crabby-images/d4088/d4088bd864c12b96ad338027c51a7b46fac5401b" alt=""
Xdes包含一个Extent的信息,如下图
用bitmap表示页(分配页用遍历的方法)。
data:image/s3,"s3://crabby-images/44958/44958e79b6501f68e9435c091019b4fb1c3b64e4" alt=""
data:image/s3,"s3://crabby-images/fb5fa/fb5fae89dd3ee9d36b68219c8435880264aaaf19" alt=""
IBUG_BITMAP PAGE
data:image/s3,"s3://crabby-images/f3b63/f3b6360e08174f0872c66a55d1442b8563ed3077" alt=""
data:image/s3,"s3://crabby-images/6ab08/6ab08a7103dfa8a4a5e2d8eb0ba9e1df6a3e5323" alt=""
INODE PAGE
表空间文件的第3个Page的类型为FIL_PAGE_INODE,存储Inode,管理表空间的Segment。每个Inode对应一个Segment。每个Inode Page默认存储FSP_SEG_INODES_PER_PAGE(85)个Inode。每个索引使用2个segment,分别用于管理叶子节点和非叶子节点。如下图
data:image/s3,"s3://crabby-images/29477/29477acfbadae46ff529ecc52786bd99022b7c60" alt=""
data:image/s3,"s3://crabby-images/6dc14/6dc14f24d4339a087e7485a7c1d57bb76a0c2d7b" alt=""
Inode管理着Segment的信息,通过FREE、NOT FULL等LIST管理着分配给自身的Extent。如下图
data:image/s3,"s3://crabby-images/3e73c/3e73c857498276f7966ddd3229c28b007efd2b46" alt=""
data:image/s3,"s3://crabby-images/13e3b/13e3b7d0a50173ec559e627f3b7cdff3d3b2fb5d" alt=""
结合上面的了解,这个IBD文件的连接方式如下图,Page 0中FSP HEADER中元素连接着IBD文件中的Inode页以及Extent(Xdes Entry),Inode Page中的Inode中元素连接着自身的Extent以及其他Inode 页。
data:image/s3,"s3://crabby-images/73dd5/73dd543002a0c1542cc54af1589ea592f4e2989d" alt=""
作用
上文中结构的作用主要是为了管理Extent和Page的申请、分配和回收。
磁盘链表
上文中多个List(如指向Xdex或Inode Page的)都是以磁盘链表形式组织的。
Innodb的磁盘链表主要是用来连接存储在磁盘上的对象。链表每项并非基于内存指针的,而是基于对象在磁盘中的位置(page no + offset)来描述。
typedef struct fil_addr_struct
{
ulint page; /*page在space中的编号*/
ulint boffset; /*page中的字节偏移量,在内存中使用2字节表示*/
}fil_addr_t;
typedef byte flst_node_t;
typedef byte flst_base_node_t;
/* The physical size of a list base node in bytes */
constexpr ulint FLST_BASE_NODE_SIZE = 4 + 2 * FIL_ADDR_SIZE;
/* The physical size of a list node in bytes */
constexpr ulint FLST_NODE_SIZE = 2 * FIL_ADDR_SIZE;
flst_node_t代表链表上的一个节点,其大小为12字节,其中前6字节(page:4 boffset:2)表示链表中前一个节点的fil_addr_t信息,后6个字节表示链表中下一个节点的fil_addr_t信息。
flst_base_node_t则用于描述链表的整体信息,包括:
链表节点个数FLST_LEN(4字节)
链表首节点的fil_addr_t (6字节)
链表尾节点的fil_addr_t(6字节)
磁盘链表结构关系
data:image/s3,"s3://crabby-images/fac40/fac40daf2b63466e14e258282ede77ed09bb5441" alt=""
每个要连接在该链表上的对象中均需要预留12个字节来记录前后节点位置。例如,xdes和inode page中均有该12字节的预留。
https://blog.csdn.net/yuanrxdu/article/details/41925279
https://zhuanlan.zhihu.com/p/86394885
http://mysql.taobao.org/monthly/2016/02/01/
网友评论