美文网首页
mysql索引原理(1)

mysql索引原理(1)

作者: 北山学者 | 来源:发表于2018-05-10 18:07 被阅读0次

    聚簇索引并不是一种单独的索引类型,而是一种数据存储方式,是对磁盘上实际数据重新组织以按指定的一个或多个列的值排序的算法。

    特点是存储数据的顺序和索引顺序一致。一般情况下主键会默认创建聚簇索引,且一张表只允许存在一个聚簇索引。

    聚簇索引的叶子节点就是数据节点,而非聚簇索引的叶子节点仍然是索引节点,只不过有指向对应数据块的指针。

    MySQL中,不同的存储引擎对索引的实现方式不同,大致说下MyISAM和InnoDB两种存储引擎。

    一、MyISAM

    MyISAM的B+Tree的叶子节点上的data,并不是数据本身,而是数据存放的地址。主索引和辅助索引没啥区别,只是主索引中的key一定得是唯一的。这里的索引都是非聚簇索引。

    MYISAM的主键索引和二级索引没有任何区别,主键索引仅仅只是一个叫做PRIMARY的唯一、非空的索引,且MYISAM引擎中可以不设主键。

    MyISAM还采用压缩机制存储索引,比如,第一个索引为“her”,第二个索引为“here”,那么第二个索引会被存储为“3,e”,这样的缺点是同一个节点中的索引只能采用顺序查找。

    MyISAM的B+tree索引结构

    二、InnoDB

    2.1什么是聚簇索引

    InnoDB 的数据文件本身就是索引文件,在同一个结构中保存了B+Tree索引和数据行。B+Tree的叶子节点上的data就是数据本身,key为主键,这是聚簇索引。

    聚簇索引的叶子节点包含了行的全部数据,索引节点则只包含索引列。

    “聚簇”表示数据行和相邻的键值紧凑地存储在一起。由于无法同时把数据行存放在两个不同的地方,所以一个表只能有一个聚簇索引。
    InnoDB的索引B+Tree索引结构

    非聚簇索引,叶子节点上的data是主键 (所以聚簇索引的key,不能过长)。为什么存放的主键,而不是记录所在地址呢,理由相当简单,因为记录所在地址并不能保证一定不会变,但主键可以保证。

    2.1聚簇索引的读取

    聚 簇索引的数据的物理存放顺序与索引顺序是一致的,即:只要索引是相邻的,那么对应的数据一定也是相邻地存放在磁盘上的。如果主键不是自增id,就会不断地调整数据的物理地址、分页,当然也有其他一些措施来减少这些操作,但却无法彻底避免。如果是自增的,那就简单了,它只需要一 页一页地写,索引结构相对紧凑,磁盘碎片少,效率也高。

    聚簇索引不但在检索上可以大大滴提高效率,在数据读取上也一样。比如:需要查询f~t的所有单词。

    一个使用MyISAM的主索引,一个使用InnoDB的聚簇索引。两种索引的B+Tree检索时间一样,但读取时却有了差异。

    因为MyISAM的主索引并非聚簇索引,那么他的数据的物理地址必然是凌乱的,拿到这些物理地址,按照合适的算法进行I/O读取,于是开始不停的寻道不停的旋转。聚簇索引则只需一次I/O。

    不过,如果涉及到大数据量的排序、全表扫描、count之类的操作的话,还是MyISAM占优势些,因为索引所占空间小,这些操作是需要在内存中完成的。

    鉴于聚簇索引的范围查询效率,很多人认为使用主键作为聚簇索引太多浪费,毕竟几乎不会使用主键进行范围查询。但若再考虑到聚簇索引的存储,就不好定论了。

    2.2非聚簇索引

    InnoDB的二级索引与主键索引有很大的不同。InnoDB的二级索引的叶子节点存放的是KEY字段加主键值,而不是行指针(row pointers),这减小了移动数据或者数据页面分裂时维护二级索引的开销,因为InnoDB不需要更新索引的行指针。

    这意味着通过二级索引查找行,存储引擎需要找到二级索引的叶子节点获得对应的主键值,然后根据这个主键值去聚簇索引查找到对应的行。

    2.3聚簇索引优缺点

    聚簇索引的优点:

    1、数据访问更快,聚集索引将索引和数据都保存在同一个B+Tree中,因此从聚集索引中获取数据通常比非聚集索引中查找更快;

    2、使用覆盖索引的查询可以直接使用节点页(非叶子页)中的主键值;

    3、可以将相关的数据聚集在一起。例如实现电子邮箱时,可以根据用户ID来聚集数据,这样只需要从磁盘读取少数的数据页就能获取某个用户的全部邮件。

    聚簇索引的缺点:

    1、 更新聚集索引列的代价很高,因为会导致InnoDB将被更新的行移动到新的位置;

    2、 二级索引会比你想象要大,因为二级索引叶子节点存放了二级索引键值和相应行的主键值;

    3、 二级索引访问数据需要二次查找,而不是一次;

    4、 聚集索引插入数据时速度比较慢(时间花费在“物理存储的排序”上),插入数据要先找到位置然后才插入。

    参考

    1、MySQL聚簇索引
    2、MYSQL性能调优: 对聚簇索引和非聚簇索引的认识
    3、mysql索引原理之聚簇索引
    4、Mysql聚簇索引和非聚簇索引原理(数据库)
    5、MySQL索引实现原理分析
    6、MySql数据库索引原理
    7、MySQL索引背后的数据结构及算法原理
    8、MySql索引原理与使用大全

    相关文章

      网友评论

          本文标题:mysql索引原理(1)

          本文链接:https://www.haomeiwen.com/subject/qfjlrftx.html