在理解MySQL锁之前还是有必要先过一下MySQL的索引,因为在讨论间隙锁的时候,会涉及到索引,不同索引导致间隙锁的行为有差别。
索引Index本质是数据结构,它能够帮助MySQL高效获取数据。
索引分类
|-- 普通索引:一个索引只包含单个列,一个表可以有多个单列索引。
|-- 唯一索引:与普通索引类似,只是索引列的值必须唯一,但是允许有空值。
|-- 主键索引:一种特殊的唯一索引,不允许有空值。一般是在建表的时候指定了主键,就会创建主键索引。
|-- 复合索引:一个索引包含多个列。
根据数据存储方式:
|-- 聚簇索引clustered index:并不是一个单独的索引类型,而是一种数据存储方式,具体细节取决于不同的实现,InnoDB的聚簇索引其实就是在同一个结构中保存了BTree索引(InnoDB只显式支持B-TREE,技术上来说是B+Tree平衡树)和数据行。
|-- 非聚簇索引secondary index:又称作二级索引、辅助索引,相对应于InnoDB的聚簇索引,MyISAM只配拥有非聚簇索引,因为MyISAM是将索引MYI和数据MYD分开存放的,也就是说找到了索引但没找到数据,需要根据索引上的值(主键)再次回表查询。
InnoDB的主键索引
Innobd中如果定义了主键,那么主键作为聚簇索引;如果没有主键,那么第一个列非空的唯一索引作为聚簇索引;如果前面都没有,那么将创建一个隐藏的row_id作为主键,并以此作为聚簇索引。
聚簇索引的叶子节点都包含主键值、事务ID、回滚指针(用于事务和MVCC)以及余下的列。
InnoDB的辅助索引
回表:辅助索引访问数据总是需要二次查找。
辅助索引叶子节点并不包含行记录的全部数据,而是主键值。通过辅助索引首先找到的是主键值,再通过主键值找到数据行的数据页,再通过数据页中的Page Directory找到数据行。
聚簇索引的优缺点
优点:
|-- 1.数据访问更快,因为聚簇索引将索引和数据保存在同一个B+树中,因此从聚簇索引中获取数据比非聚簇索引更快
|-- 2.聚簇索引对于主键的排序查找和范围查找速度非常快
缺点:
|-- 1.插入速度严重依赖于插入顺序,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键
|-- 2.更新主键的代价很高,因为将会导致被更新的行移动。因此,对于InnoDB表,我们一般【定义主键为不可更新】。
|-- 3.二级索引访问需要两次索引查找,第一次找到主键值,第二次根据主键值找到行数据。
唯一索引和普通索引的区别***
唯一索引在读取性能差不多,唯一的区别是唯一索引会有一个唯一性验证,这个唯一性验证就意味着不能用changebuffer,那么在更新的时候,唯一索引需要将数据页读入内存,然后做唯一性验证,然后插入这个值;
普通索引的更新就可以直接更新在changebuffer,然后在下次读取这个数据页的时候做merge或者别的机制将changbuffer的更新刷到数据页。
将数据从磁盘读入内存涉及随机 IO 的访问,是数据库里面成本最高的操作之一。change buffer因为减少了随机磁盘访问,所以对更新性能的提升是会很明显的。
为什么索引算法是B+树
磁盘预读:预读的长度一般为页(page)的整倍数,(在许多操作系统中,页得大小通常为4k),主存和磁盘以页为单位交换数据。
局部性原理:当一个数据被用到时,其附近的数据也通常会马上被使用,程序运行期间所需要的数据通常比较集中。
网友评论