美文网首页
innodb_ruby:窥探InnoDB的神器

innodb_ruby:窥探InnoDB的神器

作者: 阿飞的博客 | 来源:发表于2018-12-24 19:07 被阅读72次

一个InnoDB文件的解析工具,通过解析InnoDB文件,可以窥探其中很多的奥秘,绝对是一款非常优秀,高逼格的研究InnoDB的工具。但是作者不建议在生产环境使用,因为肯定有BUG,O(∩_∩)O哈哈~,作者写这个工具的主要目的是作为一个学习研究InnoDB的工具。

github地址

Github地址:https://github.com/jeremycole/innodb_ruby

安装

安装比较简单,执行命令gem install innodb_ruby即可。安装完成后,执行如下命令验证innodb_ruby是否安装成功:

[afei@afei app]# innodb_space --help

Usage: innodb_space <options> <mode>

Invocation examples:

  innodb_space -s ibdata1 [-T tname [-I iname]] [options] <mode>
  ... ...

如果提示ruby版本过低,从淘宝ruby镜像中下载高版本编译安装即可:

镜像地址:https://ruby.taobao.org/mirrors/ruby/ruby-1.9.3-p551.tar.gz
./configure --prefix=/app/ruby-2.2.10
make && make install

建议安装1.9.3-p551版本,因为当我安装了2.2.10版本的ruby后,执行innodb_space还是得到这样的错误信息:/usr/lib/ruby/gems/1.8/gems/bindata-2.4.3/lib/bindata.rb:5: BinData requires ruby >= 1.9.3。相关issue地址:https://github.com/jeremycole/innodb_ruby/issues/40。另外,安装ruby时,一步一步来,确保make以及make install时没有任何error信息。

准备数据

创建表插入数据之前,检查MySQL环境,MySQL建议5.5以上的版本,并且属性值:innodb_file_per_table=ON,innodb_file_format=Barracuda。接下来创建一张表,并借助存储过程插入一些数据:

-- 创建表
DROP TABLE IF EXISTS t_afei;
CREATE TABLE t_afei (
  id INT UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
  num int not null
) ENGINE=InnoDB;

-- 创建存储过程
DROP PROCEDURE IF EXISTS insertbatch;
CREATE PROCEDURE insertbatch()
BEGIN
DECLARE i INT;
  SET i=1;
  WHILE(i<=1000000) DO
    INSERT INTO yyfax_afei.t_afei(num)VALUES(i);
    SET i=i+1; 
  END WHILE;
END;

-- 调用存储过程
call insertbatch();

用法示例

查看索引信息--name为索引名称,fseg为leaf表示属于叶子页的segment:

[afei@afei mysql]# innodb_space -s ibdata1 -T /data/mysql/yyfax_afei/t_afei space-indexes
id      name       root    fseg        used    allocated   fill_factor 
2405    PRIMARY    3       internal    3       3           100.00%     
2405    PRIMARY    3       leaf        1743    1760        99.03% 

命令中的/data/mysql是mysql的datadir,yyfax_afei是数据库名称,t_afei是表名称。建议切换到${datadir}目录下,那么执行命令时-T的值为yyfax_afei/t_afei即可。

index-level-summary

得到指定level的所有page信息:

# level=0的page太多,所以只统计行数:
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 0  index-level-summary | wc -l
1744
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 1  index-level-summary
page    index   level   data    free    records min_key 
36      2405    1       7813    8139    601     id=1
37      2405    1       14846   838     1142    id=344688
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 2  index-level-summary
page    index   level   data    free    records min_key 
3       2405    2       26      16226   2       id=1 
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -I PRIMARY -l 3  index-level-summary
page    index   level   data    free    records min_key

我们知道level值和索引树的高度是强相关的(叶子节点的level都是0),所以通过这个命令也可以知道InnoDB索引树高度。由上面执行命令的结果可知,level=3时没有任何数据,而level等于1和2都有,所以示例100w数据的表的索引树高度是3。

space-page-type-regions

统计相同类型页的连续空间,如下所示,start/end表示起始页,count总计占的页数。

[afei@afei mysql]# innodb_space -f /data/mysql/yyfax_afei/t_afei.ibd space-page-type-regions
start       end         count       type                
0           0           1           FSP_HDR             
1           1           1           IBUF_BITMAP         
2           2           1           INODE               
3           37          35          INDEX               
38          63          26          FREE (ALLOCATED)    
64          1774        1711        INDEX               
1775        1919        145         FREE (ALLOCATED)

通过结果可知,page为0,1,2类型名称分别是:FSP_HDR, IBUF_BITMAP, INODE。从page=3开始才是存放行数据和指针的页。

index-recurse

递归一个索引需要依赖一个ruby脚本文件simple_t_describer.rb,脚本内容如下:

class SimpleTDescriber < Innodb::RecordDescriber
  type :clustered
  key "i", :INT, :UNSIGNED, :NOT_NULL
end

执行如下命令:

innodb_space -f /data/mysql/yyfax_afei/t_afei.ibd -r ~/simple_t_describer.rb -d SimpleTDescriber -p 3 index-recurse > recurseindex.log

这条命令会从root开始,全表扫描,以升序的方式遍历整个B+Tree索引树,遍历过程中会输出每个page以及指针的信息,包括叶子页和非叶子页,由于输出结果行过大(稍微大于表的行数),所以将结果重定向到一个recurseindex.log文件中:

# 表有100w数据,recurse index结果有1003491行数据
[afei@afei mysql]# wc -l recurseindex.log 
1003491 recurseindex.log

# 部分内容如下:
[afei@afei mysql]# head -10 recurseindex.log 
ROOT NODE #3: 2 records, 26 bytes
  NODE POINTER RECORD ≥ (i=1) → #36
  INTERNAL NODE #36: 601 records, 7813 bytes
    NODE POINTER RECORD ≥ (i=1) → #4
    LEAF NODE #4: 287 records, 7462 bytes
      RECORD: (i=1) → ()
      RECORD: (i=2) → ()
      RECORD: (i=3) → ()
      RECORD: (i=4) → ()
      RECORD: (i=5) → ()

从结果可知,ROOT NODE即根节点是page=3的页。通过space-page-type-regions的分析可知,0,1,2这三个page类型是FSP_HDR, IBUF_BITMAP, INODE。其他的就是INTERNAL节点和LEAF节点。

page-records

统计某一页中的数据。以刚才index-recurse的结果为例,page=3是root页,这个page的数据如下,由结果可知,page=3有两个record,与recurseindex.log的结果是吻合的(ROOT NODE #3: 2 records, 26 bytes):

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -p 3 page-records > 3.log
[afei@afei mysql]# cat 3.log 
Record 125: (id=1) → #36
Record 138: (id=344688) → #37

从这个结果也能看出来,root页是不保存具体数据,只保存主键索引的值和指针。

我们再从recurseindex.log中找几个LEAF节点,如下所示,page=1770,1771这些都是LEAF节点:

[afei@afei mysql]# grep "LEAF" recurseindex.log | tail -5
    LEAF NODE #1770: 574 records, 14924 bytes
    LEAF NODE #1771: 574 records, 14924 bytes
    LEAF NODE #1772: 574 records, 14924 bytes
    LEAF NODE #1773: 574 records, 14924 bytes
    LEAF NODE #1774: 379 records, 9854 bytes

其中,page=1770的部分数据如下,一个页大概能574条记录,而page=1774还没有填满,只有379条数据:

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/t_afei -p 1770 page-records > 1770.log
[afei@afei mysql]# head 1770.log 
Record 125: (id=997326) → (num=997326)

Record 151: (id=997327) → (num=997327)

Record 177: (id=997328) → (num=997328)

Record 203: (id=997329) → (num=997329)

Record 229: (id=997330) → (num=997330)

... ...

从这个结果也能看出来,叶子页会保存具体数据,不只是主键,非主键其他列(num列)的数据也有保存。

tree height

根据通过innodb_space得到的结果,我们大概能计算出索引树的高度,假设树的高度是h:

  • 百万级数据量的表,574^h=1000000。即h=2.17,所以百万级数据量且主键是int类型的表的索引树高度是3。
  • 十万级数据量的表,574^h=100000。即h=1.81,所以十万级数据量且主键是int类型的表的索引树高度是2。

下面是笔者对一张十万数据量的表做得测试,通过结果可以看出level=0或者1都有结果,level=2没有结果,所以索引树高度是2:

[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 0  index-level-summary | wc -l
176
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 1  index-level-summary 
page    index   level   data    free    records min_key 
3       2416    1       2275    13893   175     id=1 
[afei@afei mysql]# innodb_space -s ibdata1 -T yyfax_afei/tsw_afei -I PRIMARY -l 2  index-level-summary 
page    index   level   data    free    records min_key 
[afei@afei mysql]# 

相关文章

  • innodb_ruby:窥探InnoDB的神器

    一个InnoDB文件的解析工具,通过解析InnoDB文件,可以窥探其中很多的奥秘,绝对是一款非常优秀,高逼格的研究...

  • 使用innodb_ruby分析InnoDb索引文件

    innodb_ruby工具的安装 前置条件: 安装ruby和gem mysql的版本5.7(mysql8可能不支持...

  • 第 2 章 InnoDB 存储引擎

    2.1 InnoDB 概述 2.2 InnoDB 存储引擎的版本 2.3 InnoDB 体系架构 InnoDB 存...

  • InnoDB索引原理

    1. InnoDB中Page结构 在InnoDB中,Page是整个InnoDB存储的最基本构件,也是InnoDB磁...

  • mysql

    常见的储存引擎 InnoDB MyISAM MyISAM和InnoDB的区别 ①InnoDB支持事务,MyISAM...

  • MySQL-Innodb统计

    mysql库中有innodb_index_stats、innodb_table_stats 对innodb的信息进...

  • 2-InnoDB存储引擎

    1.InnoDB的版本 MySQL 5.1 → InnoDB 1.0X MySQL 5.5 → InnoDB 1....

  • MySQL知识点

    InnoDB与MyISAM的区别 MysSQL 5.5及以上的版本默认使用InnoDB引擎。 InnoDB特点: ...

  • Innodb Status源码分析

    (innodb status核心函数调用关系) InnoDB中执行show engine innodb statu...

  • Mysql之InnoDB存储结构

    InnoDB存储结构 Innodb逻辑存储单元为为表空间,段,区,页 InnoDB表空间 InnoDB存储引擎表中...

网友评论

      本文标题:innodb_ruby:窥探InnoDB的神器

      本文链接:https://www.haomeiwen.com/subject/wvulkqtx.html