1:什么是时效性(过期)数据
Redis是一种内存级数据库,所有数据均存放在内存中,内存中的数据可以通过TTL指令获取其状态
正数:代表该数据在内存中还能存活的时间
-1:永久有效的数据
2 :已经过期的数据 或被删除的数据 或 未定义的数据
删除策略就是针对已过期数据的处理策略,已过期的数据是真的就立即删除了吗?
其实也不是,我们会有多种删除策略,是分情况的,在不同的场景下使用不同的删除方式会有不同效果
时效性数据的存储结构:
过期数据是一块独立的存储空间,Hash结构,field是内存地址,value是过期时间,保存了所有key的过期描述,
在最终进行过期处理的时候,对该空间的数据进行检测, 当时间到期之后通过field找到内存该地址处的数据,然后进行相关操作。
一共有多个expires 一个expries里面存放一个hash表(key 有效性数据地址值 value 过期时间)
2: 数据删除策略
1:定时删除
创建一个定时器,当key设置有过期时间,且过期时间到达时,由定时器任务立即执行对键的删除操作
优点:节约内存,到时就删除,快速释放掉不必要的内存占用
缺点:CPU压力很大,无论CPU此时负载量多高,均占用CPU,会影响redis服务器响应时间和指令吞吐量
总结:用处理器性能换取存储空间(拿时间换空间)
2:惰性删除
数据到达过期时间,不做处理。
等下次访问该数据时,我们需要判断如果未过期,返回数据发现已过期,删除,返回不存在
优点:节约CPU性能,发现必须删除的时候才
删除缺点:内存压力很大,出现长期占用内存的数据
总结:用存储空间换取处理器性能(拿时间换空间)
3:定期删除:
1:Redis启动服务器初始化时,读取配置config文件 hz的值,默认为10
2:每秒钟执行 config hz次(10次) serverCron()-------->databasesCron()--------->activeExpireCycle() 流程
3:activeExpireCycle()对每个expires[*]逐一进行检测,每次执行耗时:250ms:
4:对某个expires[*]检测时,随机挑选 W(ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP属性值)个key检测
1:如果key超时,删除key
2:如果一轮中删除的key的数量>W*25%,循环该过程
3:如果一轮中删除的key的数量≤W*25%,检查下一个expires[*],0-15循环
参数current_db用于记录activeExpireCycle() 进入哪个expires[*]
执行如果activeExpireCycle()执行时间到期,下次从current_db继续向下执行
总的来说:定期删除就是周期性轮询redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比的方式控制删除频度
特点1:CPU性能占用设置有峰值,检测频度可自定义设置
特点2:内存压力不是很大,长期占用内存的冷数据会被持续清理总结:周期性抽查存储空间(随机抽查,重点抽查)
3: 淘汰策略概述
当新数据进入redis时,如果内存不足怎么办?
在执行每一个命令前,会调用freeMemoryIfNeeded()检测内存是否充足。
如果内存不满足新 加入数据的最低存储要求,redis要临时删除一些数据为当前指令清理存储空间。
清理数据的策略也称为逐出算法。
逐出数据的过程不是100%能够清理出足够的可使用的内存空间,如果不成功则反复执行。
当对所有数据尝试完毕, 如不能达到内存清理的要求,将出现错误信息如下:
(error) OOM command not allowed when used memory >'maxmemory'
1:最大可使用内存,即占用物理内存的比例,默认值为0,表示不限制。生产环境中根据需求设定,通常设置在50%以上
maxmemory ?m
2:每次选取待删除数据的个数,采用随机获取数据的方式作为待检测删除数据
maxmemory-samples count
3:对数据进行删除的选择策略
maxmemory-policy policy
config中默认配置:
# maxmemory <bytes>
maxmemory-samples 5
maxmemory-policy noeviction
推荐使用 allkeLyRs-lfu 淘汰算法 (挑选最近 使用总次数最少的数据淘汰)
淘汰单位时间内 最少使用的非热点数据
4: 淘汰策略详解
第一类:检测易失数据(可能会过期的数据集server.db[i].expires )
volatile-lru:挑选最近最少使用的数据淘汰
volatile-lfu:挑选最近 使用总次数最少的数据淘汰
volatile-random:任意选择数据淘汰,相当于随机
volatile-ttl:挑选将要过期的数据淘汰
LRU算法:
除了需要 key/value 字典外,还需要附加一个链表,链表中的元素按照一定的顺序进行排列。
当空间满的时候,会踢掉链表尾部的元素。当字典的某个元素被访问时,它在链表中的位置会被移动到表头。
所以链表的元素排列顺序就是元素最近被访问的时间顺序。
LFU算法:
果一个 key 长时间不被访问,只是刚刚偶然被用户访问了一下,那么在使用 LRU 算法下,不容易被淘汰
而 LFU 是需要追踪最近一段时间的访问频率,它需要在近期一段时间内被访问很多次才有机会被认为很热
第9秒的进行删除:
LRU:删除被访问过4次的 age 最后一次是第5秒被访问
LFU:删除被访问过1次的 gender 最后一次是第8秒被访问
第二类:检测全库数据(所有数据集server.db[i].dict )
allkeys-lru:挑选最近 最少使用的数据淘汰
allkeLyRs-lfu::挑选最近 使用总次数最少的数据淘汰
allkeys-random:任意选择数据淘汰,相当于随机
第三类:放弃数据驱逐
no-enviction(驱逐):禁止驱逐数据(redis4.0中默认策略),会引发OOM(Out Of Memory)
网友评论