美文网首页
5. 查询缓存和索引

5. 查询缓存和索引

作者: BeautifulSoulpy | 来源:发表于2020-11-18 10:37 被阅读0次

    1. 查询缓存

    查询缓存( Query Cache )原理
    缓存SELECT操作或预处理查询的结果集和SQL语句,当有新的SELECT语句或预
    处理查询语句请求,先去查询缓存,判断是否存在可用的记录集,判断标准:与缓
    存的SQL语句,是否完全一样,区分大小写
    优缺点
    不需要对SQL语句做任何解析和执行,当然语法解析必须通过在先,直接从
    Query Cache中获得查询结果,提高查询性能
    查询缓存的判断规则,不够智能,也即提高了查询缓存的使用门槛,降低其效率;
    查询缓存的使用,会增加检查和清理Query Cache中记录集的开销

    哪些查询可能不会被缓存
    查询语句中加了SQL_NO_CACHE参数
    查询语句中含有获得值的函数,包含自定义函数,如:NOW()
    CURDATE()、GET_LOCK()、RAND()、CONVERT_TZ()等 对系统数据库的查询:mysql、information_schema 查询语句中使用
    SESSION级别变量或存储过程中的局部变量
    查询语句中使用了LOCK IN SHARE MODE、FOR UPDATE的语句,查询语
    句中类似SELECT …INTO 导出数据的语句
    对临时表的查询操作;存在警告信息的查询语句;不涉及任何表或视图的查
    询语句;某用户只有列级别权限的查询语句
    事务隔离级别为Serializable时,所有查询语句都不能缓存

    查询缓存相关的服务器变量
    query_cache_min_res_unit:查询缓存中内存块的最小分配单位,默认4k,较
    小值会减少浪费,但会导致更频繁的内存分配操作,较大值会带来浪费,会导
    致碎片过多,内存不足
    query_cache_limit:单个查询结果能缓存的最大值,默认为1M,对于查询结
    果过大而无法缓存的语句,建议使用SQL_NO_CACHE
    query_cache_size:查询缓存总共可用的内存空间;单位字节,必须是1024
    的整数倍,最小值40KB,低于此值有警报
    query_cache_wlock_invalidate:如果某表被其它的会话锁定,是否仍然可以
    从查询缓存中返回结果,默认值为OFF,表示可以在表被其它会话锁定的场景
    中继续从缓存返回数据;ON则表示不允许
    query_cache_type:是否开启缓存功能,取值为ON, OFF, DEMAND

    SELECT语句的缓存控制
    SQL_CACHE:显式指定存储查询结果于缓存之中
    SQL_NO_CACHE:显式查询结果不予缓存
    query_cache_type参数变量
    query_cache_type的值为OFF或0时,查询缓存功能关闭
    query_cache_type的值为ON或1时,查询缓存功能打开,SELECT的结果符合
    缓存条件即会缓存,否则,不予缓存,显式指定SQL_NO_CACHE,不予缓存,
    此为默认值
     query_cache_type的值为DEMAND或2时,查询缓存功能按需进行,显式指
    定SQL_CACHE的SELECT语句才会缓存;其它均不予缓存
     参看:https://mariadb.com/kb/en/library/server-system-variables/#query_cache_type
    https://dev.mysql.com/doc/refman/5.7/en/query-cache-configuration.html

    查询缓存相关的状态变量:SHOW GLOBAL STATUS LIKE ‘Qcache%';
     Qcache_free_blocks:处于空闲状态 Query Cache中内存 Block 数  Qcache_total_blocks:Query Cache 中总Block ,当Qcache_free_blocks
    相对此值较大时,可能用内存碎片,执行FLUSH QUERY CACHE清理碎片
     Qcache_free_memory:处于空闲状态的 Query Cache 内存总量
     Qcache_hits:Query Cache 命中次数
     Qcache_inserts:向 Query Cache 中插入新的 Query Cache 的次数,即没
    有命中的次数
     Qcache_lowmem_prunes:记录因为内存不足而被移除出查询缓存的查询数
     Qcache_not_cached:没有被 Cache 的 SQL 数,包括无法被 Cache 的 SQL
    以及由于 query_cache_type 设置的不会被 Cache 的 SQL语句
     Qcache_queries_in_cache:在 Query Cache 中的 SQL 数量

    # 重启服务就会丢失缓存;
    MariaDB [hellodb]> set global query_cache_size=1024000;   
    
    MariaDB [hellodb]> show variables like 'query_cache%';
    +------------------------------+---------+
    | Variable_name                | Value   |
    +------------------------------+---------+
    | query_cache_limit            | 1048576 |
    | query_cache_min_res_unit     | 4096    |
    | query_cache_size             | 1024000 |
    | query_cache_strip_comments   | OFF     |
    | query_cache_type             | ON      |
    | query_cache_wlock_invalidate | OFF     |
    +------------------------------+---------+
    
    # 永久设置查询缓存;
    [root@Centos7 ~]# nano /etc/my.cnf
    [mysqld]
    query_cache_size=10M
    
    [root@Centos7 ~]# systemctl restart mariadb.service
    

    2. 命中率和内存使用率估算

    查询缓存中内存块的最小分配单位query_cache_min_res_unit : (query_cache_size - Qcache_free_memory) / Qcache_queries_in_cache
    查询缓存命中率 :Qcache_hits / ( Qcache_hits + Qcache_inserts ) * 100%
    查询缓存内存使用率:(query_cache_size – qcache_free_memory) /
    query_cache_size * 100%

    3. InnoDB存储引擎

    InnoDB存储引擎的缓冲池:
    通常InnoDB存储引擎缓冲池的命中不应该小于99%
    查看相关状态变量:
    show global status like 'innodb%read%'\G
    Innodb_buffer_pool_reads: 表示从物理磁盘读取页的次数
    Innodb_buffer_pool_read_ahead: 预读的次数
    Innodb_buffer_pool_read_ahead_evicted: 预读页,但是没有读取就从缓冲池中被替换的页数量,一般用来判断预读的效率
    Innodb_buffer_pool_read_requests: 从缓冲池中读取页次数
    Innodb_data_read: 总共读入的字节数
    Innodb_data_reads: 发起读取请求的次数,每次读取可能需要读取多个页

    4. 索引

    索引:是特殊数据结构,定义在查找时作为查找条件的字段,在MySQL又称为键key,索引通过存储引擎实现
    优点:
    索引可以降低服务需要扫描的数据量,减少了IO次数
    索引可以帮助服务器避免排序和使用临时表
    索引可以帮助将随机I/O转为顺序I/O
    缺点:
    占用额外空间,影响插入速度

    4.1 索引类型:

    B+ TREE、HASH、R TREE
    聚簇(集)索引、非聚簇索引:数据和索引是否存储在一起
    主键索引、二级(辅助)索引
    稠密索引、稀疏索引:是否索引了每一个数据项
    简单索引、组合索引
    左前缀索引:取前面的字符做索引
    覆盖索引:从索引中即可取出要查询的数据,性能高

    B+Tree索引

    B+Tree索引:顺序存储,每一个叶子节点到根结点的距离是相同的;左前缀索
    引,适合查询范围类的数据
    可以使用B+Tree索引的查询类型:
    全值匹配:精确所有索引列,如:姓wang,名xiaochun,年龄30
    匹配最左前缀:即只使用索引的第一列,如:姓wang
    匹配列前缀:只匹配一列值开头部分,如:姓以w开头的
    匹配范围值:如:姓ma和姓wang之间
    精确匹配某一列并范围匹配另一列:如:姓wang,名以x开头的
    只访问索引的查询

    B+Tree索引
    B+Tree索引的限制:
    如不从最左列开始,则无法使用索引,如:查找名为xiaochun,或姓为g结尾
    不能跳过索引中的列:如:查找姓wang,年龄30的,只能使用索引第一列
    如果查询中某个列是为范围查询,那么其右侧的列都无法再使用索引:如:姓
    wang,名x%,年龄30,只能利用姓和名上面的索引
    特别提示:
    索引列的顺序和查询语句的写法应相匹配,才能更好的利用索引
    为优化性能,可能需要针对相同的列但顺序不同创建不同的索引来满足不同类
    型的查询需求

    Hash索引

    Hash索引:基于哈希表实现,只有精确匹配索引中的所有列的查询才有效,索
    引自身只存储索引列对应的哈希值和数据指针,索引结构紧凑,查询性能好
    Memory存储引擎支持显式hash索引,InnoDB和MyISAM存储引擎不支持
    适用场景:只支持等值比较查询,包括=, <=>, IN()
    不适合使用hash索引的场景
    不适用于顺序查询:索引存储顺序的不是值的顺序
    不支持模糊匹配
    不支持范围查询
    不支持部分索引列匹配查找:如A,B列索引,只查询A列索引无效

    索引

    空间数据索引R-Tree( Geospatial indexing )
    MyISAM支持地理空间索引,可以使用任意维度组合查询,使用特有的函数访
    问,常用于做地理数据存储,使用不多
    InnoDB从MySQL5.7之后也开始支持
    全文索引(FULLTEXT)
    在文本中查找关键词,而不是直接比较索引中的值,类似搜索引擎
    InnoDB从MySQL 5.6之后也开始支持

    相关文章

      网友评论

          本文标题:5. 查询缓存和索引

          本文链接:https://www.haomeiwen.com/subject/hfwfiktx.html