innodb_ruby：窥探InnoDB的神器

作者: 阿飞的博客 | 来源:发表于2018-12-24 19:07 被阅读72次

innodb_ruby：窥探InnoDB的神器
使用innodb_ruby分析InnoDb索引文件
第 2 章 InnoDB 存储引擎
InnoDB索引原理
mysql
MySQL-Innodb统计
2-InnoDB存储引擎
MySQL知识点
Innodb Status源码分析
Mysql之InnoDB存储结构

一个InnoDB文件的解析工具，通过解析InnoDB文件，可以窥探其中很多的奥秘，绝对是一款非常优秀，高逼格的研究InnoDB的工具。但是作者不建议在生产环境使用，因为肯定有BUG，O(∩_∩)O哈哈~，作者写这个工具的主要目的是作为一个学习研究InnoDB的工具。

github地址

Github地址：https://github.com/jeremycole/innodb_ruby

安装

安装比较简单，执行命令gem install innodb_ruby即可。安装完成后，执行如下命令验证innodb_ruby是否安装成功：

[afei@afei app]# innodb_space --help

Usage: innodb_space <options> <mode>

Invocation examples:

  innodb_space -s ibdata1 [-T tname [-I iname]] [options] <mode>
  ... ...

如果提示ruby版本过低，从淘宝ruby镜像中下载高版本编译安装即可：

镜像地址：https://ruby.taobao.org/mirrors/ruby/ruby-1.9.3-p551.tar.gz
./configure --prefix=/app/ruby-2.2.10
make && make install

建议安装1.9.3-p551版本，因为当我安装了2.2.10版本的ruby后，执行innodb_space还是得到这样的错误信息：/usr/lib/ruby/gems/1.8/gems/bindata-2.4.3/lib/bindata.rb:5: BinData requires ruby >= 1.9.3。相关issue地址：https://github.com/jeremycole/innodb_ruby/issues/40。另外，安装ruby时，一步一步来，确保make以及make install时没有任何error信息。

准备数据

创建表插入数据之前，检查MySQL环境，MySQL建议5.5以上的版本，并且属性值：innodb_file_per_table=ON，innodb_file_format=Barracuda。接下来创建一张表，并借助存储过程插入一些数据：

-- 创建表
DROP TABLE IF EXISTS t_afei;
CREATE TABLE t_afei (
  id INT UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
  num int not null
) ENGINE=InnoDB;

-- 创建存储过程
DROP PROCEDURE IF EXISTS insertbatch;
CREATE PROCEDURE insertbatch()
BEGIN
DECLARE i INT;
  SET i=1;
  WHILE(i<=1000000) DO
    INSERT INTO yyfax_afei.t_afei(num)VALUES(i);
    SET i=i+1; 
  END WHILE;
END;

-- 调用存储过程
call insertbatch();

用法示例

查看索引信息--name为索引名称，fseg为leaf表示属于叶子页的segment：

[afei@afei mysql]# innodb_space -s ibdata1 -T /data/mysql/yyfax_afei/t_afei space-indexes
id      name       root    fseg        used    allocated   fill_factor 
2405    PRIMARY    3       internal    3       3           100.00%     
2405    PRIMARY    3       leaf        1743    1760        99.03%

命令中的/data/mysql是mysql的datadir，yyfax_afei是数据库名称，t_afei是表名称。建议切换到${datadir}目录下，那么执行命令时-T的值为yyfax_afei/t_afei即可。

index-level-summary

得到指定level的所有page信息：

# level=0的page太多，所以只统计行数：
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 0  index-level-summary | wc -l
1744
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 1  index-level-summary
page    index   level   data    free    records min_key 
36      2405    1       7813    8139    601     id=1
37      2405    1       14846   838     1142    id=344688
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 2  index-level-summary
page    index   level   data    free    records min_key 
3       2405    2       26      16226   2       id=1 
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 3  index-level-summary
page    index   level   data    free    records min_key

我们知道level值和索引树的高度是强相关的（叶子节点的level都是0），所以通过这个命令也可以知道InnoDB索引树高度。由上面执行命令的结果可知，level=3时没有任何数据，而level等于1和2都有，所以示例100w数据的表的索引树高度是3。

space-page-type-regions

统计相同类型页的连续空间，如下所示，start/end表示起始页，count总计占的页数。

[afei@afei mysql]# innodb_space -f /data/mysql/yyfax_afei/t_afei.ibd space-page-type-regions
start       end         count       type                
0           0           1           FSP_HDR             
1           1           1           IBUF_BITMAP         
2           2           1           INODE               
3           37          35          INDEX               
38          63          26          FREE (ALLOCATED)    
64          1774        1711        INDEX               
1775        1919        145         FREE (ALLOCATED)

通过结果可知，page为0,1,2类型名称分别是：FSP_HDR, IBUF_BITMAP, INODE。从page=3开始才是存放行数据和指针的页。

index-recurse

递归一个索引需要依赖一个ruby脚本文件simple_t_describer.rb，脚本内容如下：

class SimpleTDescriber < Innodb::RecordDescriber
  type :clustered
  key "i", :INT, :UNSIGNED, :NOT_NULL
end

执行如下命令：

innodb_space -f /data/mysql/yyfax_afei/t_afei.ibd -r ~/simple_t_describer.rb -d SimpleTDescriber -p 3 index-recurse > recurseindex.log

这条命令会从root开始，全表扫描，以升序的方式遍历整个B+Tree索引树，遍历过程中会输出每个page以及指针的信息，包括叶子页和非叶子页，由于输出结果行过大（稍微大于表的行数），所以将结果重定向到一个recurseindex.log文件中：

# 表有100w数据，recurse index结果有1003491行数据
[afei@afei mysql]# wc -l recurseindex.log 
1003491 recurseindex.log

# 部分内容如下：
[afei@afei mysql]# head -10 recurseindex.log 
ROOT NODE #3: 2 records, 26 bytes
  NODE POINTER RECORD ≥ (i=1) → #36
  INTERNAL NODE #36: 601 records, 7813 bytes
    NODE POINTER RECORD ≥ (i=1) → #4
    LEAF NODE #4: 287 records, 7462 bytes
      RECORD: (i=1) → ()
      RECORD: (i=2) → ()
      RECORD: (i=3) → ()
      RECORD: (i=4) → ()
      RECORD: (i=5) → ()

从结果可知，ROOT NODE即根节点是page=3的页。通过space-page-type-regions的分析可知，0,1,2这三个page类型是FSP_HDR, IBUF_BITMAP, INODE。其他的就是INTERNAL节点和LEAF节点。

page-records

统计某一页中的数据。以刚才index-recurse的结果为例，page=3是root页，这个page的数据如下，由结果可知，page=3有两个record，与recurseindex.log的结果是吻合的（ROOT NODE #3: 2 records, 26 bytes）：

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -p 3 page-records > 3.log
[afei@afei mysql]# cat 3.log 
Record 125: (id=1) → #36
Record 138: (id=344688) → #37

从这个结果也能看出来，root页是不保存具体数据，只保存主键索引的值和指针。

我们再从recurseindex.log中找几个LEAF节点，如下所示，page=1770，1771这些都是LEAF节点：

[afei@afei mysql]# grep "LEAF" recurseindex.log | tail -5
    LEAF NODE #1770: 574 records, 14924 bytes
    LEAF NODE #1771: 574 records, 14924 bytes
    LEAF NODE #1772: 574 records, 14924 bytes
    LEAF NODE #1773: 574 records, 14924 bytes
    LEAF NODE #1774: 379 records, 9854 bytes

其中，page=1770的部分数据如下，一个页大概能574条记录，而page=1774还没有填满，只有379条数据：

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -p 1770 page-records > 1770.log
[afei@afei mysql]# head 1770.log 
Record 125: (id=997326) → (num=997326)

Record 151: (id=997327) → (num=997327)

Record 177: (id=997328) → (num=997328)

Record 203: (id=997329) → (num=997329)

Record 229: (id=997330) → (num=997330)

... ...

从这个结果也能看出来，叶子页会保存具体数据，不只是主键，非主键其他列（num列）的数据也有保存。

tree height

根据通过innodb_space得到的结果，我们大概能计算出索引树的高度，假设树的高度是h：

百万级数据量的表，574^h=1000000。即h=2.17，所以百万级数据量且主键是int类型的表的索引树高度是3。
十万级数据量的表，574^h=100000。即h=1.81，所以十万级数据量且主键是int类型的表的索引树高度是2。

下面是笔者对一张十万数据量的表做得测试，通过结果可以看出level=0或者1都有结果，level=2没有结果，所以索引树高度是2：

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 0  index-level-summary | wc -l
176
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 1  index-level-summary 
page    index   level   data    free    records min_key 
3       2416    1       2275    13893   175     id=1 
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 2  index-level-summary 
page    index   level   data    free    records min_key 
[afei@afei mysql]#

innodb_ruby：窥探InnoDB的神器
一个InnoDB文件的解析工具，通过解析InnoDB文件，可以窥探其中很多的奥秘，绝对是一款非常优秀，高逼格的研究...
使用innodb_ruby分析InnoDb索引文件
innodb_ruby工具的安装前置条件: 安装ruby和gem mysql的版本5.7(mysql8可能不支持...
第 2 章 InnoDB 存储引擎
2.1 InnoDB 概述 2.2 InnoDB 存储引擎的版本 2.3 InnoDB 体系架构 InnoDB 存...
InnoDB索引原理
1. InnoDB中Page结构在InnoDB中，Page是整个InnoDB存储的最基本构件，也是InnoDB磁...
mysql
常见的储存引擎 InnoDB MyISAM MyISAM和InnoDB的区别 ①InnoDB支持事务,MyISAM...
MySQL-Innodb统计
mysql库中有innodb_index_stats、innodb_table_stats 对innodb的信息进...
2-InnoDB存储引擎
1.InnoDB的版本 MySQL 5.1 → InnoDB 1.0X MySQL 5.5 → InnoDB 1....
MySQL知识点
InnoDB与MyISAM的区别 MysSQL 5.5及以上的版本默认使用InnoDB引擎。 InnoDB特点： ...
Innodb Status源码分析
(innodb status核心函数调用关系) InnoDB中执行show engine innodb statu...
Mysql之InnoDB存储结构
InnoDB存储结构 Innodb逻辑存储单元为为表空间,段,区,页 InnoDB表空间 InnoDB存储引擎表中...

innodb_ruby：窥探InnoDB的神器

github地址

安装

准备数据

用法示例

index-level-summary

space-page-type-regions

index-recurse

page-records

tree height

相关文章

innodb_ruby：窥探InnoDB的神器

使用innodb_ruby分析InnoDb索引文件

第 2 章 InnoDB 存储引擎

InnoDB索引原理

mysql

MySQL-Innodb统计

2-InnoDB存储引擎

MySQL知识点

Innodb Status源码分析

Mysql之InnoDB存储结构

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读