美文网首页
Redis数据结构与对象——整数集合

Redis数据结构与对象——整数集合

作者: HRADPX | 来源:发表于2019-07-07 11:05 被阅读0次

整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现。

1 整数集合的实现

  整数集合(intset)是Redis用于整数值的集合抽象数据结构,它可以保存类型为int16_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。
  每个intset结构表示一个整数集合

typedef struct intset{
   // 编码方式
   uint32_t encoding;
  // 集合包含的元素数量
  uint32_t length;
  // 保存元素的数组
  int8_t contents[];
} intset

(1) contents数组是整数集合的底层实现:整数集合的每个元素都是contents数组的一个数组项,各个项在数组中按值的大小从小到大有序得排序,并且数组中不包含任何重复项。
(2) length属性记录了整数集合包含的元素的数量。
(3) 虽然intset结构将contents属性声明为int8_t类型的数组,但是实际上contents数组并不包含任何int8_t类型的值,contents数组的真正类型取决于encoding属性的值:
  encodings的取值可以为INTSET_ENC_INT16(-215~215)、INTSET_ENC_INT32、INTSET_ENC_INT64,分别表示contents是一个int16_t、int32_t、int64_t类型的数组,数组中的每个整数值的所占的空间大小分别是16个二进制位、32个二进制位、64个二进制位。

  下图展示了一个包含5个int16_t类型的数组



  contents数组按照从小到大的顺序保存着集合中的5个元素,每个元素都是int16_t类型的整数值,所以contents数组的大小等于sizeof(int16_t) * 5 = 16 * 5 = 80个二进制位。

2 升级

  当将一个新元素添加到整数集合中,并且新元素的类型比整数集合现有的所有元素类型都要长时,整数集合需要先进行升级(upgrade),然后将新元素添加到整数集合中。
  升级整数集合并添加新元素共分为三步:

(1) 根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间。
(2) 将底层数组现有的所有元素转换成与新元素相同的类型,并将类型转换后的元素放置到正确的位上,而且防止元素的过程中,需要继续维持底层数组的有序性不变。
(3) 将新的元素添加到底层数组里面。

  下图表示一个包含三个int16_t类型的元素集合,每个元素占用16个位空间,故一共占用48个位。




  现在要在集合中插入一个int32_t类型的整数65535,因为集合中元素类型都是int16_t,所以需要先对整数集合进行升级。首先需要对底层数组进行空间重分配,由于每个元素占32个位,故一共需要128位。



  因为元素3在1、2、3和65535四个元素中排第三,故它将会被移动到数组索引为2的位置上,即64至95位上。依次类推,将原来的三个元素放置在正确的位置上。最后,将新元素65535放置在最后一个位置上。


  最后,程序将整数集合encoding属性值从INTSET_ENC_INT16改为INTSET_ENC_INT32,并将length属性的值从3改为4,设置完成后的集合如下图所示。


完成添加操作后的整数集合

3 升级的好处

   3.1 提高灵活性

  因为C语言是静态类型语言,为了避免类型错误,通常不会将两种不同类型的值放在同一个数据结构中。
  但是,因为整数集合可以通过自动升级底层数组来适应新元素,所以可以随意将int16_t、int32_t或者int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。

   3.2 节约内存

  如果要让一个数组可以同时保存int16_t、int32_t或者int64_t三种类型的值,最简单的就是直接使用int64_t类型的数组作为整数集合的底层实现。不过这样即使数组只保存int16_t类型的数,数组都需要使用int64_t类型的空间去保存它们,从而出现浪费内存的情况。
  而整数集合即可以让集合能同时保存三种不同类型的值,又可以确保升级操作只会在有需要的时候进行,可以尽量节省内存。

4 降级

  整数集合不支持降级操作,一旦对数组进行了升级,编码就会一直保持升级后的状态。
  对于上例,即使删除了65535这个数,集合中剩余的元素虽然可以占用空间更少的int16_t类型保存,但是集合的编码仍然会维持INTSET_ENC_INT32,底层数组也仍然会是int32_t类型。

5 小结

(1) 整数集合的底层实现是数组,这个数组可以有序、无重复的方式保存集合元素,在有需要的时候,程序会根据新添加的元素类型,改变这个数组的类型。
(2) 升级操作为整数集合带来了操作上的灵活性,并且尽可能的节约了内存。
(3) 整数集合支持升级操作,不支持降级操作。
  本文完


  注:本文参考《Redis设计与实现》,如发现错误,请指正!

相关文章

  • 整数集合

    整数集合 整数集合(intset)是 Redis 用于保存整数值的集合抽象数据结构, 它可以保存类型为 >int1...

  • redis数据结构(四):整数集合 intset

    数据结构 整数集合是redis为了保存整数值的集合而抽象出来的数据结构。intset数据结构 看这意思,也是把数组...

  • Redis数据结构与对象——整数集合

    整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redi...

  • 6.整数集合

    整数集合 1. 整数集合的实现 整数集合是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int16_...

  • redis底层数据组织方式

    底层数据结构 redis底层数据结构有:字典、双端链表、压缩链表、整数集合、跳跃表和字典、整数集合、embstr ...

  • Redis对象

    1 对象 Redis基于C语言实现了简单动态字符串,双端链表,字典,压缩列表,整数集合等数据结构,基于这些数据结构...

  • Redis 整数集合

    整数集合是 Redis 用于保存整数值的有序的集合抽象数据结构,当一个集合只包含整数值元素,并且这个集合的元素数量...

  • intset.c

    Redis中的intset,表示整数集合,用来存储整数,在set数据结构中用到。 intset的数据结构如下: 1...

  • Redis-数据结构-对象

    对象 redis没有直接使用SDS、链表、字典、压缩列表、整数集合等数据结构来实现 键值对数据库,而是基于这些数...

  • Redis专题

    1 数据结构与对象 1.Redis数据结构与对象——简单动态字符串2.Redis数据结构与对象——哈希3.Redi...

网友评论

      本文标题:Redis数据结构与对象——整数集合

      本文链接:https://www.haomeiwen.com/subject/ptzvhctx.html