美文网首页
初始化ConcurrentHashMap时初始容量不是2的n次幂

初始化ConcurrentHashMap时初始容量不是2的n次幂

作者: 犄角芝士 | 来源:发表于2018-11-15 16:20 被阅读0次

    一、ConcurrentHashMap构造方法

    使用ConcurrentHashMap的该构造方法可以指定初始容量。

    public ConcurrentHashMap(int initialCapacity) 
        // 校验初始容量不能小于0
        if (initialCapacity < 0)
            throw new IllegalArgumentException();
        int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
                   MAXIMUM_CAPACITY :
                   tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
        this.sizeCtl = cap;
    }
    

    如果initialCapacity大于最大容量的一半时,就取最大容量。

    // 1无符号左移30位,也就是二进制1后面跟着30个0。Java中int有32位,第一位为符号位。所以1<<30为int类型中, 最大且是2的n(正整数)次幂的数。
    private static final int MAXIMUM_CAPACITY = 1 << 30;
    

    否则执行tableSizeFor()方法。

    二、tableSizeFor()方法

    /**
     * 根据容量参数,返回一个2的n次幂的table长度。
     */
    private static final int tableSizeFor(int c) {
        int n = c - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
    

    先看一下tableSizeFor()的输入与输出

    public static void main(String[] args) {
        System.out.println(tableSizeFor(1));
        System.out.println(tableSizeFor(5));
        System.out.println(tableSizeFor(25));
        System.out.println(tableSizeFor(125));
        System.out.println(tableSizeFor(625));
    }
    
    输出:
    1
    8
    32
    128
    1024
    

    通过输出可以大致猜到tableSizeFor的作用是返回一个大于输入参数且最小的为2的n次幂的数。

    我们再来看看是怎么做到的。

    当输入为25的时候,n等于24,转成二进制为1100,右移1位为0110,将1100与0110进行或("|")操作,得到1110。接下来右移两位得11,再进行或操作得1111,接下来操作n的值就不会变化了。最后返回的时候,返回n+1,也就是10000,十进制为32。按照这种逻辑得到2的n次幂的数。

    再来看一个例子,当n=1<<30的时候:

    01 00000 00000 00000 00000 00000 00000 (n)   
    01 10000 00000 00000 00000 00000 00000 (n |= n >>> 1)    
    01 11100 00000 00000 00000 00000 00000 (n |= n >>> 2)    
    01 11111 11000 00000 00000 00000 00000 (n |= n >>> 4)    
    01 11111 11111 11111 00000 00000 00000 (n |= n >>> 8)    
    01 11111 11111 11111 11111 11111 11111 (n |= n >>> 16)    
    

    由于int类型为32位,所有即使除符号为之外只有第一位为1的情况,也能将所有的位全部变成1,不过由于最后计算出来为int类型的最大值,此时返回n+1会导致溢出,不能返回期望的结果,这也是为什么在方法开始是要执行int n = c - 1;的原因。

    三、tableSizeFor()的参数

    那么为什么tableSizeFor()的参数为initialCapacity + (initialCapacity >>> 1) + 1而不是直接传入initialCapacity呢?

    在ConcurrentHashMap有一个参数LOAD_FACTOR,默认值为0.75f。假设当前map容量为16,当其中的元素个数达到16*0.75f,也就是12个的时候,map为了最大化利用hash的作用,会进行扩容,也就是map中的元素个数一般不会达到容量的大小。

    使用参数initialCapacity + (initialCapacity >>> 1) + 1来设置容量,不至于在初始化时就超过上诉"12"这个元素,并且能提供一些多余的空间,不至于在插入元素后马上就进行比较耗时的扩容操作。

    相关文章

      网友评论

          本文标题:初始化ConcurrentHashMap时初始容量不是2的n次幂

          本文链接:https://www.haomeiwen.com/subject/hniyfqtx.html