算法学习----位运算

作者: 亼亼 | 来源:发表于2016-06-07 21:42 被阅读160次

    布隆过滤器

    不安全网页的黑名单包含100亿个黑名单网页,每个网页的URL最多占用64字节,现在想要实现一种网页过滤系统,可以根据网页的URL判断该网页是否在黑名单上,请设计该系统。
    要求该系统允许有万分之一以下的判断失误率,并且使用的额外空间不要超过30G。

    解决方法采用布隆过滤器
    黑名单----存入>哈希表或者数据库
    数量:100亿
    单个url:64kB    那么应该需要640G的空间,不
    符合要求。
    
    生成布隆过滤器的过程:
    布隆过滤器的生成过程.png

    相关文章

      网友评论

        本文标题:算法学习----位运算

        本文链接:https://www.haomeiwen.com/subject/xgzddttx.html