美文网首页
redis 内部数据结构(1.1)-字符串

redis 内部数据结构(1.1)-字符串

作者: 颜灏_2181 | 来源:发表于2017-03-24 11:15 被阅读0次

    简单动态字符串 sds

    数据结构

    typedef char *sds;
    
    struct sdshdr {
            // 记录 buf 数组中已使用字节的数量
            // 等于 SDS 所保存字符串的长度
            int len;
            // 记录 buf 数组中未使用字节的数量
            int free;
            // 字节数组,用于保存字符串
            char buf[];
    };
    

    与 C 中字符串结构不同的是,C语言需要遍历字符串以确认字符串结束的位置(On),SDS 的效率是 O1.

    SDS 的好处不止于此,还可以避免在修改 buf,尤其是追加情况下, 的内存溢出问题。

    内存分配

    直接引用别人博客里说的内容吧。

    1. 在函数sdsnewlen中,根据是否需要初始化使用zmalloc和zcalloc两个不同函数。
    2. 计算字符串长度的时候,直接使用函数sdslen,不需要调用strlen。
    3. 需要扩展free的空间时, 需要调用函数sdsMakeRoomFor, 该函数空间分配策略比较有意思, 如果free>=addlen,直接返回。 否则判断free+addlen是否小于SDS_MAX_PREALLOC这个宏, 如果小于,那么这次就分配2*(free+addlen)的空间, 这样每次多分配一陪的空间; 否则就分配free+addlen+SDS_MAX_PREALLOC的空间。 这样可以控制最大多分配多少的空间, 以至于不要浪费太多空间。例如: sds old=sdsnew("test one"); sds new=sdscat(old,"test"); 此时有12的空余空间, 如果再次调用``sdscat(new,”test”)``, 那么就不需要分配空间。
    4. 在函数sdscatvprintf中, 空间申请是以16,32,64..这样增长的, 无处不透露提高性能。
    5. 在函数sdscmp中, 调用memcmp, 性能要比strcmp好, 而且还是二进制安全的。
    6. 在函数sdssplitlen中, 默认分配的数组为5, 然后按照2的倍数进行增长, 这样做法,有点浪费空间,但是加快速度,不要每分割出来一个字符串就要申请空间。 比较的时候把seplen为1分出来, 也是加快字符串比较速度的考虑, 大部分时候应该是seplen为1。
    

    增加的情况

    为什么需要用 free,为什么需要预先分配内存空间?
    其实目的很明确,就是避免过多次的分配内存空间,因为这个过程时间消耗很大。如果需要修改字符串,检查 free 是否够用,如果够则不分配内存,否则分配。达到减少内存变动次数的目的。

    预分配空间的大小是这样决定的:

    1 length >> 20 > 1,length 对于的大小超过 1M,分配 1M 的free
    2 length >> 20 <=1, 分配与 length 相同大小的 free
    

    减少的情况-惰性空间释放

    用几个图来说明释放时候 free 的变化情况:

    初始状态 释放全部 x,y 的状态图 释放后追加的状态

    其他

    SDS 是二进制安全的,比 C 只能保存文本数据相比具有更多的优势。可以兼容部分 C 语言中的字符串函数。

    相关文章

      网友评论

          本文标题:redis 内部数据结构(1.1)-字符串

          本文链接:https://www.haomeiwen.com/subject/vbwxottx.html