InnoDB buffer pool之LRU算法【Mysql I

作者: judeshawn | 来源:发表于2019-08-11 21:59 被阅读0次

InnoDB buffer pool之LRU算法【Mysql I
[转载]MySQL参数之 innodb_buffer_pool
InnoDB Buffer Pool详解（缓冲池）
Innodb_buffer_pool_read_requests
mysql8 参数以及调优
第31节：Innodb Buffer Pool的三种Page和链
Mysql 常用语句
MySQL ( MGR ) 04-MYSQL5.7 InnoDB
MySQL - InnoDB Buffer Pool
MySQL基准测试1

下面的图片展现了组成InnoDB存储引擎的内存结构和磁盘结构。

InnoDB体系结构

InnoDB内存结构

Buffer Pool缓冲池

缓冲池是缓冲需要被访问的表和索引数据的内存区域。为了加速，缓冲池将频繁访问的数据直接放在内存中处理。在专有服务器（dedicated server）上，通常给缓冲池分配高达80%的总内存。

为了提升大批量读操作的效率，缓冲池被分成了很个页（page），每个页可以容纳多个行。为了提升缓存管理的效率，缓冲池里的块是以链表的形式存放；基于LRU算法的一种变体，很少使用的数据会随着时间被踢出缓存。

如何利用缓冲池将频繁使用的数据留在内存中，是Mysql优化的一个重要方面。

缓冲池LRU算法

缓冲池是按照LRU（least recently used最近最少使用）算法的一种变体来管理的一个链表。当进入新的数据页需要空间时，最近一段时间内最少使用的页会被踢出，然后新进来的页会放在列表的中间。中间点的选择方案是，把列表分成两个子列表：

列表头，新页子列表，最近访问过的
列表尾，旧页子列表，最近很少访问的

缓冲池列表

这个算法会将频繁使用的页保留在新页子列表。旧页子列表包含很少使用的页；这些页做好了被踢出的准备。

默认情况下，算法是这样操作的：

缓冲池的3/8分给旧页子列表
列表的中间点是新页子列表的尾部和旧页子列表的头部的连接处，即新旧子列表的交界点
当InnoDB将页读取进缓冲池，最开始是放在中间点。触发读页进缓冲池的操作除了普通的SQL查询，还可以是InnoDB自动执行的read ahead操作，即预读功能。

什么是read ahead？

一种异步IO请求机制，预先将一组数据页（一整个区extent，64个页page）放进缓冲池，因为这个区有可能很马上就需要访问，因此提前做好准备。分为linear read ahead线性预读和random read ahead随机预读。

线性预读
若前一个区内被顺序访问的数据块数量超过一个固定值（innodb_read_ahead_threshold系统变量），就会预先读取一个下一个区中的所有页（这里读取和访问不是一回事）

随机预读
一个区内缓存在缓冲池的连续数据页数量一旦超过13，就会将这个区的所有块都预先缓存

访问一个旧页子列表的页会让这个页变‘新’，它会被移动到缓冲池列表的头部，并且是新页列表的头部。如果页的读取是由于被语句需要，则页立即会被标记为已访问并加入新页子列表，如果是由于read ahead机制被预读，则不会立即被标记为已访问（页有可能直到被踢出也都不会被访问）。
缓冲池中的页会按照最近一次访问的时间排序，未被访问的页会慢慢移向列表的尾部。从中间点写入页会导致旧页列表里原有的页往尾部移动。最终会把最久未被使用的哪些页挤出缓冲池。

默认情况下，查询读取的页会立刻被移动到了新页子列表，意味着他们会在缓冲池中存留更长时间。全表扫描（例如Mysqldump操作,或者没有where条件的select语句）会将大量数据加载进行缓冲池，同时会踢出等量更旧的数据，即使新数据或许很难被再次使用。类似地，通过预读自动被加载进缓冲池之后，一旦被访问，就会移动到新页子列表头部。这些情况都会使得频繁使用的页被挤到旧页子列表，进而被挤出缓冲池。有一种技术是可以优化这种情况的，这项技术通过innodb_old_blocks_time系统变量设置了一个时间阈值（单位为ms），从第一次访问一个页开始，这个时间窗口范围内的访问不会将这个页移动到新也子列表的头部（暂时放在旧页子列表，这个时间窗口过后若仍然需要访问，才会将这个页移动到新列表的头部）。

InnoDB标准监控输出的BUFFER POOL AND MEMORY部分有一些信息是关于缓冲池LRU算法的操作。