美文网首页
redis源码之set结构的实现

redis源码之set结构的实现

作者: 程序员小饭 | 来源:发表于2021-05-10 13:44 被阅读0次

    关于set的命令和常用场景我们暂时先不说了,如果对命令不太熟悉的朋友可以用 help @set命令查看,我们先来看set中的一种现象

    127.0.0.1:6379> sadd set-1 a b c d e
    (integer) 5
    127.0.0.1:6379> SMEMBERS set-1
    1) "a"
    2) "c"
    3) "d"
    4) "b"
    5) "e"
    

    大家都知道set是一种无序的集合,通过SMEMBERS取出所有元素,元素是无序的展示的,这一切很正常,但是我们接着往下看

    127.0.0.1:6379> sadd set-2 1 2 3 4 5 6
    (integer) 6
    127.0.0.1:6379> SMEMBERS set-2
    1) "1"
    2) "2"
    3) "3"
    4) "4"
    5) "5"
    6) "6"
    

    这一次我们给set-2添加的元素全部都是数字,通过SMEMBERS取出所有元素,结果居然是排序过的(如果给set-2再添加任意一个非数字的元素,结果立即会变为无序),但是我们都知道set是一种无序的集合,这是为什么呢?
    其实我们可以分别看一下set-1和set-2的类型

    127.0.0.1:6379> object encoding set-1
    "hashtable"
    127.0.0.1:6379> object encoding set-2
    "intset"
    

    我们发现set-1是hashtable类型,而set-2是intset类型的
    \color{red} {其实对于redis的set类型来说,set是无序的,自动去重的集合数据类型,set数据结构底层实现}
    \color{red} {为一个value为null的字典(dict),当数据可以用整型表示时,set集合将被编码为intset数据结}
    \color{red} {构。两个条件任意满足时set将用hashtable存储数据。1:元素个数大于set-max-iniset-entries(默认为512)} \color{red} {2:元素无法用整型表示}
    set-max-iniset-entries
    其实intset类型的源码也比较简单

    typedef struct intset {
        uint32_t encoding;  //编码类型
        uint32_t length;  //元素个数
        int8_t contents[];  //元素存储
    } intset;
    
    #define INTSET_ENC_INT16 (sizeof(int16_t))
    #define INTSET_ENC_INT32 (sizeof(int32_t))
    #define INTSET_ENC_INT64 (sizeof(int64_t))
    

    整型集合是一个有序的,存储整型数据的结构,整型集合在redis中可以保存int16_t,int32_t,int64_t类型的整型数据,并且可以保证集合中不会出现重复数据。
    intset​的优势主要在于查找方便,毕竟已经排过序,另外是否需要扩容也很好判断,直接看最大的值就可以了

    相关文章

      网友评论

          本文标题:redis源码之set结构的实现

          本文链接:https://www.haomeiwen.com/subject/yqlzyktx.html