美文网首页
InnoDB buffer pool之LRU算法【Mysql I

InnoDB buffer pool之LRU算法【Mysql I

作者: judeshawn | 来源:发表于2019-08-11 21:59 被阅读0次

    下面的图片展现了组成InnoDB存储引擎的内存结构和磁盘结构。


    InnoDB体系结构

    InnoDB内存结构


    Buffer Pool缓冲池

    缓冲池是缓冲需要被访问的表和索引数据的内存区域。为了加速,缓冲池将频繁访问的数据直接放在内存中处理。在专有服务器(dedicated server)上,通常给缓冲池分配高达80%的总内存。

    为了提升大批量读操作的效率,缓冲池被分成了很个页(page),每个页可以容纳多个行。为了提升缓存管理的效率,缓冲池里的块是以链表的形式存放;基于LRU算法的一种变体,很少使用的数据会随着时间被踢出缓存。

    如何利用缓冲池将频繁使用的数据留在内存中,是Mysql优化的一个重要方面。

    缓冲池LRU算法

    缓冲池是按照LRU(least recently used最近最少使用)算法的一种变体来管理的一个链表。当进入新的数据页需要空间时,最近一段时间内最少使用的页会被踢出,然后新进来的页会放在列表的中间。中间点的选择方案是,把列表分成两个子列表:

    • 列表头,新页子列表,最近访问过的
    • 列表尾,旧页子列表,最近很少访问的


      缓冲池列表

      这个算法会将频繁使用的页保留在新页子列表。旧页子列表包含很少使用的页;这些页做好了被踢出的准备。

    默认情况下,算法是这样操作的:

    • 缓冲池的3/8分给旧页子列表
    • 列表的中间点是新页子列表的尾部和旧页子列表的头部的连接处,即新旧子列表的交界点
    • 当InnoDB将页读取进缓冲池,最开始是放在中间点。触发读页进缓冲池的操作除了普通的SQL查询,还可以是InnoDB自动执行的read ahead操作,即预读功能。

    什么是read ahead?

    一种异步IO请求机制,预先将一组数据页(一整个区extent,64个页page)放进缓冲池,因为这个区有可能很马上就需要访问,因此提前做好准备。分为linear read ahead线性预读和random read ahead随机预读。

    • 线性预读
      若前一个区内被顺序访问的数据块数量超过一个固定值(innodb_read_ahead_threshold系统变量),就会预先读取一个下一个区中的所有页(这里读取和访问不是一回事)
    • 随机预读
      一个区内缓存在缓冲池的连续数据页数量一旦超过13,就会将这个区的所有块都预先缓存
    • 访问一个旧页子列表的页会让这个页变‘新’,它会被移动到缓冲池列表的头部,并且是新页列表的头部。如果页的读取是由于被语句需要,则页立即会被标记为已访问并加入新页子列表,如果是由于read ahead机制被预读,则不会立即被标记为已访问(页有可能直到被踢出也都不会被访问)。

    • 缓冲池中的页会按照最近一次访问的时间排序,未被访问的页会慢慢移向列表的尾部。从中间点写入页会导致旧页列表里原有的页往尾部移动。最终会把最久未被使用的哪些页挤出缓冲池。

    默认情况下,查询读取的页会立刻被移动到了新页子列表,意味着他们会在缓冲池中存留更长时间。全表扫描(例如Mysqldump操作,或者没有where条件的select语句)会将大量数据加载进行缓冲池,同时会踢出等量更旧的数据,即使新数据或许很难被再次使用。类似地,通过预读自动被加载进缓冲池之后,一旦被访问,就会移动到新页子列表头部。这些情况都会使得频繁使用的页被挤到旧页子列表,进而被挤出缓冲池。有一种技术是可以优化这种情况的,这项技术通过innodb_old_blocks_time系统变量设置了一个时间阈值(单位为ms),从第一次访问一个页开始,这个时间窗口范围内的访问不会将这个页移动到新也子列表的头部(暂时放在旧页子列表,这个时间窗口过后若仍然需要访问,才会将这个页移动到新列表的头部)。

    InnoDB标准监控输出的BUFFER POOL AND MEMORY部分有一些信息是关于缓冲池LRU算法的操作。

    相关文章

      网友评论

          本文标题:InnoDB buffer pool之LRU算法【Mysql I

          本文链接:https://www.haomeiwen.com/subject/hnzcjctx.html