HyperLogLog
简介
redis的基数统计,这个结构可以非常省内存的去统计各种计数。它是一个基于基数估算算法,但并不绝对准确,标准误差是0.81%。HyperLogLog数据结构的发明人是Philippe Flajolet,pf是名字首字母缩写
原理
HyperLogLog最大占用12KB的存储空间。当计数比较小时,使用稀疏矩阵存储,占用空间很小,在变大到超过阈值时,会转变成稠密矩阵,占用12KB
算法:给定一系列的随机整数,记录低位连续0位的最大长度K,通过K可以估算出随机数的数量N
命令
- 基础命令
pfadd 增加数据
pfcount 统计数据去重
网友评论