预防缓存击穿-布隆过滤器

作者: 若丨寒 | 来源:发表于2019-04-17 16:03 被阅读19次

预防缓存击穿-布隆过滤器
Redis布隆过滤器之初体验
PHP 操作 Redis bloomfilter 布隆过滤器
使用布隆过滤器预防缓存穿透
布隆过滤器
Guava - 布隆过滤器的使用
缓存穿透、缓存击穿、缓存雪崩、缓存热点原理及方案【通俗版】
解决缓存击穿的利器-布隆过滤器
防止缓存击穿/缓存雪崩/缓存穿透-布隆过滤器(BloomFilt
kata05:布隆过滤器

为什么使用布隆过滤器

布隆过滤器是用来判断一个元素是否出现在给定集合中的重要工具,具有快速，比哈希表更节省空间等优点，而缺点在于有一定的误识别率
布隆过滤器(bloom filter)是Google Guava类库里面的组件
当代换联网环境下使用缓存的公司可说遍地都是大家都知道使用缓存就是为了缓存一些冷数据以减少数据库压力
查询一些缓存不存在的数据透过缓存直接查询数据库
服务报错

布隆过滤器代码实现

代码实现

    package com.f.fmodules.fuser.bloom;

    import com.google.common.base.Charsets;
    import com.google.common.hash.BloomFilter;
    import com.google.common.hash.Funnels;

    import java.util.*;

    public class BloomFilterDemo {

        public static void main(String[] args) {
            final int count = 500000;
            List<String> stringList = new ArrayList<>(count);
            Set<String> stringSet = new HashSet<>();
            //创建布隆过滤器 初始化过滤器数据
            BloomFilter<String> bloomString = BloomFilter.create(Funnels.stringFunnel(Charsets.UTF_8),count);
            for (int i =0;i< count;i++){
                String id = UUID.randomUUID().toString();
                stringList.add(id);
                stringSet.add(id);
                bloomString.put(id);
            }
            int wrong = 0;
            int right = 0;
            for (int i =0;i< count; i++) {
                String checkString = i % 100 == 0 ? stringList.get(i) : UUID.randomUUID().toString();
                //布隆过滤器 进过hash算法和byte数组 校验是否存在于集合中
                if (bloomString.mightContain(checkString)){
                    //校验是否误判
                    if (stringSet.contains(checkString)){
                        right++;
                    }else{
                        wrong++;
                    }
                }
            }
            System.out.println("50万测试数据-->共抵挡: "+(count - wrong - right)+"次非法入侵"+"    误判"+wrong);
        }
    }

运行结果
为什么会有14721次误判呢咱们跟进源码进行深入探索
深入源码可发现误判率在百分之三的情况下有300多万个byte数组会进行5次hash算法进行判断数据是否存在已知数据中

初始化布隆过滤器时设置误判率为0.01

    //创建布隆过滤器 初始化过滤器数据
    BloomFilter<String> bloomString = BloomFilter.create(Funnels.stringFunnel(Charsets.UTF_8),count,0.001);

debug深入源码

此时发现误判率设置为百分之一的情况下 byte数组达到七百多万而需要进行的hash算法次数达到十次
查看运行结果

结果可看出误判率为百分之一的情况下 5000次正确访问只有500多次误判(并不是设置的误判率越小越好误判率越小需要进行hash计算次数越多消耗资源越多)

预防缓存击穿-布隆过滤器
为什么使用布隆过滤器布隆过滤器是用来判断一个元素是否出现在给定集合中的重要工具,具有快速，比哈希表更节省空间等优...
Redis布隆过滤器之初体验
之前，小马在聊缓存击穿和穿透的文中有介绍过防止缓存穿透其中的一种方式是使用布隆过滤器，那什么是布隆过滤器呢？今天就...
PHP 操作 Redis bloomfilter 布隆过滤器
redis 4.0 提供的布隆过滤器插件应用场景：过滤，防止缓存缓存击穿等等缺点：数据不精确，存在一定的误判率
使用布隆过滤器预防缓存穿透
一般不太大的公司没有人攻击，所以也就不太关注缓存击穿的问题，看到一篇使用布隆过滤器可以有效预防缓存穿透问题。原文链...
布隆过滤器
布隆过滤器起源为什么我们要用布隆过滤器？布隆过滤器是在海量数据找到想要的结果，经常应用于redis的缓存穿透（...
Guava - 布隆过滤器的使用
布隆过滤器简单介绍布隆过滤器介绍 maven引入布隆过滤器的使用参考及拓展 Guava的布隆过滤器布隆过滤...
缓存穿透、缓存击穿、缓存雪崩、缓存热点原理及方案【通俗版】
缓存穿透缓存中不存在，穿透到DB解决方案：采用布隆过滤器空值写进缓存，设置短时间缓存击穿缓存过期，同时大...
解决缓存击穿的利器-布隆过滤器
一。什么是缓存击穿在高并发场景下，如果某一个key被高并发访问，没有被命中，出于对容错性考虑，会尝试去从后...
防止缓存击穿/缓存雪崩/缓存穿透-布隆过滤器(BloomFilt
Bloom Filter是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属...
kata05:布隆过滤器
这次kata的内容:实现一个布隆过滤器布隆过滤器 (Bloom Filter) 什么是布隆过滤器呢?简单来说, ...