美文网首页Java架构技术进阶Java互联网科技
带你搞明白什么是缓存穿透、缓存击穿、缓存雪崩

带你搞明白什么是缓存穿透、缓存击穿、缓存雪崩

作者: java菲菲 | 来源:发表于2020-04-23 18:35 被阅读0次

    推荐学习

    1. “银四”之初,惊喜收到美团电话面,却被“redis”惹祸上身!
    2. 秋招JAVA面试总结:Java+并发+Spring+MySQL+分布式+Redis+算法+JVM等
    3. 美团一面凉凉:MySQL+Java+Redis+算法+网络+Linux等一个都讲不清

    缓存是互联网开发中必不可少的一部分,它能降低我们数据库的并发数,提高我们系统的性能,比如我们经常使用的redis、emCached等等,其中redis应该是大部分的人选,为什么?因为速度快,易上手,是很多开发者的首选,但是缓存同样存在这问题,如果使用的不恰当,也可能会造成非常严重的后果,这时候你可能就会有疑问,缓存只是存储一些数据而已,怎么会造成严重的后果呢?下面我就带大家一起来分析分析。

    什么是缓存

    缓存(cache),原始意义是指访问速度比一般随机存取存储器(RAM)快的一种高速存储器,通常它不像系统主存那样使用DRAM技术,而使用昂贵但较快速的SRAM技术。缓存的设置是所有现代计算机系统发挥高性能的重要因素之一。
    比如我们的redis、他就是缓存中比较常见的一种,他的并发读写能力能达到10w/s左右的速度,这个速度是相当不错的,相对于传统的数据存储来说,比如数据库,快了不知道多少倍,传统的数据库(mysql)操作的都是磁盘,而redis操作的是内存(ram),所以他们的速度肯定是没法比较的,由于传统数据库的读写较慢,所以并发较高的时候就会造成性能瓶颈问题,这也是为什么需要引入缓存的原因之一。

    人在地上走,锅从天上来

    我是一个快乐的程序狗,每天最快乐的事情就是codding,最大的愿望就是能准时6点下班,然后回家,但是今天肯定是走不了了,现在是17:30,我们的测试小哥哥给我提了一个很诡异的bug,难受啊,我的准时下班梦,但是作为一个程序狗,肯定都有着一颗和bug战斗到底的决心,究竟是什么bug呢?
    bug是这样的:并发请求订单信息,没过几秒就抛出系统错误。这个bug看着没几个字,但是一看就知道不好解决,尤其是像这种并发bug,能让人瞬间白了头,随后我找到了测试,让他们复现了这个神秘的bug,而我也找到了产生这个bug的来源,并且快速的修复了他,到底是什么问题呢?是因为小明(同事)在编写代码的时候考虑的不是很周全导致的,所以开发一定要想仔细了再动手,否则吃亏的就是自己啊。

    缓存穿透

    什么是缓存穿透

    缓存穿透指的是:同一时刻,大量的并发请求数据库中不存在的信息,他既不会命中缓存,也不会命中数据库,但是他会查找数据库。
    上面的bug也是因为它产生的,测试的小哥哥查询的订单都是数据库不存在的,所以这个时候这些并发请求都不会命中缓存(redis),将直达数据库(mysql),由于大量的并发请求到达数据库,而数据库承受不住这么高的并发,从而导致数据库奔溃,这就是缓存穿透。
    重现bug
    1.新建数据表:订单表,结构如下:

    image.png

    2.编写测试代码
    OrderBo.java

    package com.ymy.bo;
    
    import lombok.Data;
    
    import java.io.Serializable;
    import java.math.BigDecimal;
    
    @Data
    public class OrderBo implements  Serializable {
    
        /**
         * 自增id
         */
        private Long id;
    
        /**
         *订单编号
         */
        private Long orderCode;
    
        /**
         *订单价格
         */
        private BigDecimal orderPrice;
    
        /**
         *商品名称
         */
        private String  peoductName;
    
        /**
         *创建时间
         */
        private String createTime;
    }
    

    OrderController.java

    package com.ymy.controller;
    
    import com.ymy.bo.OrderBo;
    import com.ymy.service.OrderService;
    import org.springframework.web.bind.annotation.RequestMapping;
    import org.springframework.web.bind.annotation.RequestMethod;
    import org.springframework.web.bind.annotation.RequestParam;
    import org.springframework.web.bind.annotation.RestController;
    
    @RestController
    public class OrderController {
    
        private OrderService orderService;
    
        public OrderController(OrderService orderService){
            this.orderService = orderService;
        }
    
        @RequestMapping(value = "/detail",method = RequestMethod.GET)
        public OrderBo getDetail(@RequestParam("id") Long id){
    
            return orderService.getDetail(id);
        }
    
    
    }
    

    OrderService.java

    package com.ymy.service;
    
    import com.ymy.bo.OrderBo;
    import com.ymy.mapper.OrderMapper;
    import lombok.extern.slf4j.Slf4j;
    import org.springframework.data.redis.core.RedisTemplate;
    import org.springframework.stereotype.Service;
    
    @Service
    @Slf4j
    public class OrderService {
    
        private RedisTemplate redisTemplate;
    
        private OrderMapper orderMapper;
    
        public OrderService(RedisTemplate redisTemplate,OrderMapper orderMapper){
            this.redisTemplate = redisTemplate;
            this.orderMapper = orderMapper;
        }
        /**
         * 通过id查询订单详情
         * @param id
         * @return
         */
        public OrderBo getDetail(Long id) {
    
            //缓存中查询词词订单
            OrderBo  orderBo = (OrderBo) redisTemplate.opsForValue().get("order:" + id);
            if(orderBo != null ){
                log.info("缓存中查询到了信息,直接返回:{}",orderBo);
                return orderBo;
            }
            log.info("前往数据库查询");
            orderBo =  orderMapper.getDetail(id);
            if(orderBo != null ){
               //将数据保存到数据库,有效时间一小时
               redisTemplate.opsForValue().set("order:" + id,orderBo,3600,TimeUnit.SECONDS);
               log.info("数据已经存入缓存");
            }
            return orderBo;
        }
    }
    

    OrderMapper.java

    package com.ymy.mapper;
    
    import com.ymy.bo.OrderBo;
    import org.apache.ibatis.annotations.Mapper;
    import org.apache.ibatis.annotations.Select;
    
    @Mapper
    public interface OrderMapper {
        /**
         * 通过订单id查询订单信息
         * @param id
         * @return
         */
        @Select(" select id,order_code as orderCode,order_price as orderPrice,peoduct_name as peoductName,create_time as createTime from orders where id = #{id} ")
        OrderBo getDetail(Long id);
    }
    

    RedisConfig.java

    package com.ymy.config;
    
    import com.fasterxml.jackson.annotation.JsonAutoDetect;
    import com.fasterxml.jackson.annotation.PropertyAccessor;
    import com.fasterxml.jackson.databind.ObjectMapper;
    import org.springframework.context.annotation.Bean;
    import org.springframework.context.annotation.Configuration;
    import org.springframework.data.redis.connection.RedisConnectionFactory;
    import org.springframework.data.redis.core.RedisTemplate;
    import org.springframework.data.redis.serializer.Jackson2JsonRedisSerializer;
    import org.springframework.data.redis.serializer.StringRedisSerializer;
    
    @Configuration
    public class RedisConfig {
    
        @Bean
        public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) {
            RedisTemplate<Object, Object> redisTemplate = new RedisTemplate<>();
            redisTemplate.setConnectionFactory(redisConnectionFactory);
    
            // 使用Jackson2JsonRedisSerialize 替换默认序列化
            Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class);
    
            ObjectMapper objectMapper = new ObjectMapper();
            objectMapper.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
            objectMapper.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);
    
            jackson2JsonRedisSerializer.setObjectMapper(objectMapper);
    
            // 设置value的序列化规则和 key的序列化规则
            redisTemplate.setKeySerializer(new StringRedisSerializer());
            redisTemplate.setValueSerializer(jackson2JsonRedisSerializer);
            redisTemplate.setHashKeySerializer(new StringRedisSerializer());
            redisTemplate.setHashValueSerializer(jackson2JsonRedisSerializer);
            redisTemplate.afterPropertiesSet();
            return redisTemplate;
        }
    }
    

    上面的代码实现的功能很简单,通过订单id查询订单详情,不过查询的循序是先查缓存,如果缓存没有数据,在查询数据库,大致流程图如下:


    image.png

    这个过程很简单,看上去没有什么问题,如果你仔细观察的话就会发现一个致命的问题,就是刚刚说的缓存穿透问题,我们来做个实验。

    我在数据库提前添加了一条数据,信息如下:


    在这里插入图片描述

    正常情况:查询id等于1的订单信息。

    第一次:


    在这里插入图片描述
    2020-04-19 15:55:35.564  INFO 20188 --- [nio-9900-exec-1] com.ymy.service.OrderService             : 前往数据库查询
    2020-04-19 15:55:35.675  INFO 20188 --- [nio-9900-exec-1] com.ymy.service.OrderService             : 数据已经存入缓存
    

    由于是第一次查询,所以缓存中不会存在数据,请求直接到达了数据库,并且获取到了id为1的数据,并且将数据添加到了缓存。


    image.png

    第二次查询id等于1的数据

    2020-04-19 15:57:47.879  INFO 20188 --- [nio-9900-exec-5] com.ymy.service.OrderService             : 缓存中查询到了信息,直接返回:OrderBo(id=1, orderCode=202004191416, orderPrice=3299.00, peoductName=iphone se2, createTime=2020-04-19 14:17:07)
    

    我们发现他直接命中了缓存,直接返回,这是正常情况,那如果非正常情况呢?比如查询的订单id=-1呢?这个时候会发生什么事情?
    http://localhost:9900/detail?id=-1

    image.png

    看到没有,请求全都进入数据库了,这种情况是肯定不被允许的,如果你的程序中存在这种情况,一定要赶紧修改,否则有可能会让一些心怀不轨的人直接将数据库的服务搞宕机,那这种问题如何解决呢?

    解决方案

    将空数据存入缓存

    什么意思呢?简单点来说,不管数据库中有没有查询到数据,都往缓存中添加一条数据,这样下次请求的时候就会直接在缓存中返回,这种方式比较简单粗暴,我们一起看看如何实现。

    代码改造:

    OrderService.java

     public OrderBo getDetail(Long id) {
            //缓存中查询词词订单
            Object obj =  redisTemplate.opsForValue().get("order:" + id);
            if(obj != null ){
                String data = obj.toString();
                log.info("缓存中查询到了信息,直接返回:{}",data);
                return  "".equals(data)  ? null : (OrderBo) obj;
            }
            log.info("前往数据库查询");
            OrderBo orderBo =  orderMapper.getDetail(id);
            if(orderBo != null ){
                //将数据保存到数据库,有效时间一小时
               redisTemplate.opsForValue().set("order:" + id,orderBo,3600,TimeUnit.SECONDS);
               log.info("数据已经存入缓存");
            }else {
                redisTemplate.opsForValue().set("order:" + id,"",300,TimeUnit.SECONDS);
                log.info("数据库中不存在此数据,但是为了防止缓存穿透,存入一条空数据到缓存中");
            }
            return orderBo;
        }
    

    往缓存中添加数据的时候一定要注意值的问题,请看我这里,我添加的是一个空字符串,并不是null,是因为我判断的条件是缓存中!=null就直接返回,如果你往缓存中添加一条null的数据,这个时候就会和你的判断起冲突,又会进入到数据库了,所以这点需要特别注意,我们来看测试:
    第一次请求:http://localhost:9900/detail?id=-1

    2020-04-19 16:23:21.520  INFO 16596 --- [nio-9900-exec-6] com.ymy.service.OrderService             : 前往数据库查询
    2020-04-19 16:23:21.577  INFO 16596 --- [nio-9900-exec-6] com.ymy.service.OrderService             : 数据库中不存在此数据,但是为了防止缓存穿透,存入一条空数据到缓存中
    

    第二次请求:http://localhost:9900/detail?id=-1

    2020-04-19 16:24:25.855  INFO 16596 --- [nio-9900-exec-9] com.ymy.service.OrderService             : 缓存中查询到了信息,直接返回:
    

    这个时候请求命中了缓存,就不会前往数据库中了,但是这个需要注意一点:空值的过期时间不能设置的太长,什么意思呢?设想一下,我们现在数据库中只有id=1的数据,我们查询id=2也会往缓存中插入一条数据,但是这个时候数据库中新增了一条订单id=2,用户下次查询的时候看到你存储在缓存中中的数据,接直接回了空,但是数据库中明明已经添加了这条数据,这就是为什么过期时间不要设置太久的原因,当然了,我们也需要分情况考虑,比如查询id<=0的,我们都可以考虑永久存入缓存或者设置很长的过期时间,推荐设置很长的过期时间,为什么呢?因为订单id不存在会<=0,但是对于>=0,我们可以将过期时间设置为30秒等等,这个看业务需求即可。

    布隆过滤器

    布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。
    这个算法实现起来比上面第一种稍微复杂一点,这里就不具体说明了,如果感兴趣的话可以百度自行了解一下,不是很难。

    缓存击穿

    什么是缓存击穿

    缓存击穿是指热点key在某个时间点过期的时候,而恰好在这个时间点对这个Key有大量的并发请求过来,从而大量的请求打到db(数据库)。
    这个也不难理解,和缓存穿透有点像但是性质又不相同,都是缓存中没有数据,请求命中数据库,缓存穿透指的是数据库中不存在的数据,缓存击穿则是指缓存失效的问题。,这种情况不太好模拟,我们可以直接将缓存中数据清空,替代缓存数据过期。
    代码还是上面的代码,不做任何修改,不过我们不再使用postman测试,而是采用jemter,首先我们删除缓存中的数据,模拟key已经过期,我们查询id=1的订单详细信息,但需要注意的是,我并不是发一个请求,而是100个同时请求,会发生什么呢?
    线程数:

    image.png
    Http请求信息
    在这里插入图片描述

    聚合报告

    在这里插入图片描述

    我们发现100个并发请求全部成功,异常率为0,接下来就是重点了,控制台会打印什么呢?


    image.png

    这就是缓存击穿,是不是很恐怖,虽然命中数据库的次数不是很多,那是因为我们的并发请求不是很大,像双十一这种并发,如果存在这种问题,数据库可能撑不过3秒就炸了。

    解决方案

    自动更新

    什么是自动更新呢?这个有点类似与jwt的自动刷新token机制,jwt的自动刷新token实现原理大致为:请求的时候判断一下token的剩余有效时间,如果有效时间小于设定的时间,那么jwt将生成一个新的token,然后再将次token重新设置过期时间,并将新的token返回给前端使用,这个也可以参考一下,redis是支持查询某个key剩余有效时间,所以这里我们只需要设定一个时间差,比如3分钟,请求的时候查询的有效时间如果小于3分钟,那么刷新这个key的有效时间,刷新这个操作可以使用异步实现(提高性能)。
    可能你想到了,这种方式存在缺陷,没错,如果再快失效的3分钟内没有请求,那么缓存中的key将不会被刷新,还是会存在缓存击穿的问题,所以这种方式不是特别推荐

    定时刷新

    定时刷新有两种方案

    第一种:定时任务
    查询快要过期的key,更新内容,并刷新有效时间,这种比较消耗服务器性能,也不是特别推荐。
    第二种:延迟队列
    如果大家了解它的话可能一下就知道我说的是什么意思了,将数据存入缓存的那一刻同时发送一个延迟队列(安指定时间消费),时间小于缓存中key的过期时间,到了指定时间,消费者刷新key的有效时间再发送一个延迟队列,以此循环,这种方式还是不错的,但是实现方式相对于第一种来说就要复杂一点了,他需要依靠消息中间件来完成,如果消息中间件某个时间宕机,那就gg了,虽然这种方式虽然比较推荐,但是成本偏高,因为为了防止消息中间件宕机,我们有可能需要对消息中间件做集群处理。

    程序加锁

    我个人推荐使用这个,为什么呢?因为它不需要额外的服务器开销,也不需要额外的资源消耗,他仅仅只是让线程串行而已,但是这个时候你可能就会有疑问了,加锁不是会严重影响程序的效率吗?为什么你还推荐这种方式呢?
    其实并不是所有的锁都会很大的降低程序的性能,这里我们当然不能使用synchronized,原因很简单,他的效率比较慢,不太适合这种情况,我要介绍的这种锁名字为:读写锁。

    好了,我们一起来改造一下之前的代码
    OrderService.java

    package com.ymy.service;
    
    import com.ymy.bo.OrderBo;
    import com.ymy.mapper.OrderMapper;
    import lombok.extern.slf4j.Slf4j;
    import org.springframework.data.redis.core.RedisTemplate;
    import org.springframework.stereotype.Service;
    
    import java.util.concurrent.TimeUnit;
    import java.util.concurrent.atomic.AtomicInteger;
    import java.util.concurrent.locks.Lock;
    import java.util.concurrent.locks.ReadWriteLock;
    import java.util.concurrent.locks.ReentrantReadWriteLock;
    
    @Service
    @Slf4j
    public class OrderService {
    
        private RedisTemplate redisTemplate;
    
        private OrderMapper orderMapper;
    
        private static  final AtomicInteger count = new AtomicInteger(0);
    
    
        private static final ReadWriteLock readWriteLock = new ReentrantReadWriteLock();
    
    
        public OrderService(RedisTemplate redisTemplate, OrderMapper orderMapper) {
            this.redisTemplate = redisTemplate;
            this.orderMapper = orderMapper;
        }
    
    
        /**
         * 通过id查询订单详情
         *
         * @param id
         * @return
         */
        public  OrderBo getDetail(Long id) {
            int num = count.incrementAndGet();
            //获取读锁
            Lock readLock = readWriteLock.readLock();
            try {
                readLock.lock();
                //缓存中查询订单信息
                log.info("前往缓存中查询信息,第一次,这是第:{}次请求",num);
                Object obj = redisTemplate.opsForValue().get("order:" + id);
                if (obj != null) {
                    String data = obj.toString();
                    log.info("缓存中查询到了信息,直接返回:{}", data);
                    return "".equals(data) ? null : (OrderBo) obj;
                }
                log.info("没有在缓存中获取到数据,即将前往数据库获取,这是第:{}次请求",num);
            } finally {
                //释放读锁
                readLock.unlock();
            }
            //获取写锁
            Lock writeLock = readWriteLock.writeLock();
            try{
                writeLock.lock();
                //缓存中查询订单信息
                log.info("第二次前往缓存中查询信息,这是第:{}次请求",num);
                Object obj = redisTemplate.opsForValue().get("order:" + id);
                if (obj != null) {
                    String data = obj.toString();
                    log.info("缓存中查询到了信息,直接返回:{}", data);
                    return "".equals(data) ? null : (OrderBo) obj;
                }
                log.info("前往数据库查询,这是第:{}次请求",num);
                OrderBo orderBo = orderMapper.getDetail(id);
                log.info("数据库返回的数据:{},这是第:{}次请求",orderBo,num);
                if (orderBo != null) {
                    //将数据保存到数据库,有效时间一小时
                    redisTemplate.opsForValue().set("order:" + id, orderBo, 3600, TimeUnit.SECONDS);
                    log.info("数据已经存入缓存,这是第:{}次请求",num);
                } else {
                    redisTemplate.opsForValue().set("order:" + id, "", 300, TimeUnit.SECONDS);
                    log.info("数据库中不存在此数据,但是为了防止缓存穿透,存入一条空数据到缓存中,这是第:{}次请求",num);
                }
                return orderBo;
            }finally {
                writeLock.unlock();
            }
        }
    }
    

    加了读写锁之后我们一起来看看控制台的输出结果:


    image.png

    这只是其中一部分,由于输出的内容过长我就不全部展示出来了,我们这里需要关注的只有一个,数据库查询了多少次?
    我们将控制台日志拷贝到notepad++中,搜索“数据库返回的数据”,请看结果:


    image.png

    我们可以看到,查询数据库的操作只有一处,但是查询缓存的确实并发执行的,这就是为什么我推荐使用读写锁的原因,读写锁中读锁和写锁是互斥的,你觉得这样速度还是不够快,能不能读锁和写锁并行?答案是肯定的

    缓存雪崩

    什么是缓存雪崩

    缓存雪崩是指缓存中数据大批量到过期时间,而查询数据量巨大,引起数据库压力过大甚至宕机。
    为什么会出现大批量的key过期呢?是不是我们设置了相同的过期时间导致的?

    解决方案

    随机设置过期时间

    这个随机时间并不是真正的随机时间,而是指在原来过期时间的基础上生成一个随机时间,这个随机时间比较小,然后两者相加即可

    设置永久有效

    将一些常用的数据设置成为永久有效,注意哦,是经常使用的而不是全部,这点需要特别注意。

    总结

    什么是缓存穿透?

    同一时刻,大量的并发请求数据库中不存在的信息,他既不会命中缓存,也不会命中数据库,但是他会查找数据库。

    什么是缓存击穿?

    缓存击穿是指热点key在某个时间点过期的时候,而恰好在这个时间点对这个Key有大量的并发请求过来,从而大量的请求打到db(数据库)。

    什么是缓存雪崩?

    缓存中数据大批量到过期时间,而查询数据量巨大,引起数据库压力过大甚至宕机
    并不是只有上面几种解决方案,这里我只是讲解了几种常用的解决方案,在日常开发中我们可以根据实际的业务需求进行选择,没有最好的,只有最适合自己的,所以不一定要选择最牛逼的解决方案,但是一定要选择最适合项目的解决方案。


    image.png

    作者:卖托儿索的小火柴
    原文链接:https://blog.csdn.net/qq_33220089/article/details/105614087

    相关文章

      网友评论

        本文标题:带你搞明白什么是缓存穿透、缓存击穿、缓存雪崩

        本文链接:https://www.haomeiwen.com/subject/jonaihtx.html