大家好,我是安小生,本文章重点讲解了一下MySQL中的索引。
分为4个点。
- myisam主键索引与普通索引的区别。
- innodb主键索引与普通索引的区别。
- innodb索引与myisam索引的区别。
- innodb回表查询。
- hash索引。
- 全文搜索引擎。
myisam主键索引与普通索引的区别
我们先来看一下myisam的主键索引与普通索引的区别。
myisam索引的结构也是B+TREE索引的方式去实现,但是他的主键索引与普通的特点是与innodb是不通的。我们可以看一下下面的图。
myisam主键索引跟普通索引区别.png
在图中分为主键索引与普通索引,主键索引中非叶子节点记录了索引的信息以及数据的行记录位置,而他的叶子节点是记录的实际的数据,普通索引也是一样的,非叶子节点记录了索引的信息以及行记录,叶子节点记录的实际的数据,是的myisam的主键索引与普通索引区别不大,唯一的区别也就是索引所存储的数据了。
innodb的主键索引与普通索引区别:
innodb主键索引与普通索引区别.png在innodb中我们可与看到,主键索引与普通索引与myisam的结构是一样的,但是在叶子节点的所储存的数据却是不通的,innodb的普通索引所记录的是世纪的数据以及主键索引的记录,也就是说:innodb的普通索引查询会进行二次查询,当然这个两次查询的也是有前提的。比如sql语句如下:
select * from user where name="php"
在这个语句中想要查询的字段是表中的全部字段,而索引idx_name(name)只是记录了name以及主键的id的数据,其他字段的数据在该索引中查询不到,索引需要在通过主键索引去定位其他字段的数据,在返回结果。
innodb索引与myisam索引的区别:
myisam:myisam储存引擎的普通索引与主键索引在索引指向方面都是指定喂,实际的数据在磁盘中的位置。
innodb:innodb存储引擎的普通索引与主键索引在索引指定主键索引的数据以及索引相关字段的数据在磁盘中的位置。
主键索引指向的是数据在磁盘中的位置。
而两个索引的储存位置也不是一样的。
myisam:数据跟索引文件是分开储存的=》非聚集索引。
innodb:数据跟索引文件储存在一起的。=》聚集索引。
innodb回表查询。
什么是回表呢?这个问题是由普通索引引起的。是在innodb储存下。不过这个需要注意一下就好。引起这个的问题是。MySQL语句查询的时候用到了普通索引,获取的数据只要不存在与索引中的情况下就出现回表。
大概的意思是:根据sql语句查询的时候,用到了普通索引然后查询到了主键,然后又去主键索引去磁盘中检索数据去了。就是这么一个意思。
比如:
sql语句:select count(*),name,age,from user where nname = 'php'
建立索引:alter table user add index idx_name(name)
这条sql语句在查询的时候,会先在普通中进行查询数据,然后发现没有age 字段,在去获取到name=‘php’ 所对应的主键值,在根据主键值索引中找到表中对应的数据,最后进行返回数据。
innodb查询数据.png
覆盖索引
主键索引:主要是主键。
普通索引:普通索引是一个范围的定义,比如单列索引以及联合索引其实都是属于普通索引。
联合索引建立语法:alter table user add index idx_name_age(name,age);
--建立一个name与age相关的联合索引
下面我们看一个案例语句:
select count(*),name,age from user where name="php";l
这个语句中有name,以及age,可以直接通过覆盖索引的方式来解决回表查询的问题。
alter table user add index idx_name_age(name,age);简历一个name与age相关的联合索引。
这个是在去查询,他就会普通索引也可以返回给我们,sql语句所需要的数据了。就不在需要在进行回表查询了。
innodb查询数据-覆盖索引.png
hash索引
我们听说过得hash一般是有hash算法,还有hash加密等,比如:会有xxxx的代码使用了hash算法,hash加密 ,一般的话会有32位,64位的字符串。
hash索引概念:mysql会根据我们的字段进行hash计算生成一个字符串,这个字符串就是磁盘数据的地址。
基于哈希表实现,只有精确匹配索引所有列的查询才有效,对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码(hash code),哈希码是一个较小的值,
大部分情况下不同的键值的行计算出来的哈希码是不同的,但是也会有例外,就是说不同列值计算出来的hash值一样的(即所谓的hash冲突),哈希索引将所有的哈希码存储
在索引中,同时在哈希表中保存指向每一个数据行的指针,hash很适合做索引,为某一列或几列建立hash索引,就会利用这一列或几列的值通过一定的算法计算出一个hash值,
对应一行或几行数据。
hash索引.png
针对上图的理解:
keys:代表创建索引的列值;
buckets: 就是计算出来的hash值和对应的数据的物理位置组成的hash表;
entries:就是代表具体的数据行;
创建hash索引后,会为每个键值通过特定的算法计算出一个哈希码(hash code),需要注意的是不同的键值计算出来的hash值可能是相同的,例上图上的 John Smith 和Sandra Dee算出来的hash值都是152,
然后找到hash值为152在hash表中的存储数据的物理位置,这个位置对应着两条数据也(就是John Smith 521-1234 和Sandra Dee 521-9655),然后再次遍历这两条数据,
找到需要的数据,这就解释了为啥hash冲突严重了,hash索引效率降低的原因。
innodb引擎有一个特殊的功能叫做自适应哈希索引,当innodb注意到某些索引值被使用的非常频繁时,它会在内存中基于btree索引之上再创建一个哈希索引,这样就让btree索引也具有哈希索引的一些优点,
比如:
快速的哈希查找,这是一个全自动的,内部的行为,用户无法控制或者配置,不过如果有必要,可以选择关闭这个功能(innodb_adaptive_hash_index=OFF,默认为ON)。
全文索引
根据名称创建的全文索引
alter table customers1 add fulltext index testfulltext(name) with parser ngram;
select * from customers1 where match(name) against('-化实',in boolean mode) limit 0,5;
网友评论