美文网首页
ConcurrentHashMap的扩容

ConcurrentHashMap的扩容

作者: HannahLi_9f1c | 来源:发表于2021-01-06 20:43 被阅读0次

    一、触发扩容的条件

    1. addCount(put、remove、clear、computeIfAbsent、compute、merge)
      数组长度>0.75n触发扩容


      addCount中调用transfer

      sizeCtl<0说明已经在扩容了
      否则是第一个扩容,使用CAS更新sizeCtl,保证只有一个线程第一次进入transfer方法,nextTable是null

    2. tryPresize(putAll、treeifyBin)
      treeifyBin触发tryPresize条件:链表长度>8并且数组大小小于64,则不树化而是尝试扩容


      tryPresize调用transfer

      可以看出来,跟上面调用tranfer的逻辑差不多

    3. helpTransfer(putAll、remove、clear、computeIfAbsent、compute、merge)
      f.hash=MOVED触发扩容,这里的MOVED是在扩容中的setTabAt会把ForwardingNode的hash置为MOVED


      helpTransfer调用transfer

      通过CAS将sizeCtl+1

    二、扩容源码分析

    1. sizeCtl的状态流转
      未初始化:
      sizeCtl=0:表示没有指定初始容量。
      sizeCtl>0:表示初始容量。
      初始化中:
      sizeCtl=-1,标记作用,告知其他线程,正在初始化
      正常状态:
      sizeCtl=0.75n ,扩容阈值
      扩容中:
      sizeCtl < 0 : 表示有其他线程正在执行扩容
      sizeCtl = (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2 :表示此时只有一个线程在执行扩容
      sizeCtl含义:


      sizeCtl变化

    https://blog.csdn.net/unknownfuture/article/details/105350537

    1. transferIndex的作用
      表示扩容的位移,多线程会修改这个值,因此是volatile类型,通过CAS修改,初始值是n数组大小,每次减去步长大小


      修改transferindex
    2. transfer
    //该方法通过全局的transferIndex来控制每个线程的迁移任务
    private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
            //n为旧tab的长度,stride为步长(就是每个线程迁移的节点数)
            int n = tab.length, stride;
            //单核步长为1,多核为(n>>>3)/ NCPU,最小值为16
            if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
                stride = MIN_TRANSFER_STRIDE; // subdivide range
            if (nextTab == null) {            // initiating
                try {
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                    nextTab = nt;
                } catch (Throwable ex) {      // try to cope with OOME
                    sizeCtl = Integer.MAX_VALUE;
                    return;
                }
                //nextTable为全局属性
                nextTable = nextTab;
                //transferIndex也为全局属性,用于控制迁移位置
                transferIndex = n;
            }
            int nextn = nextTab.length;
            //ForwardingNode是正在被迁移的Node,它的key,value,next都为null
            //hash为MOVED,其中有个nextTable属性指向新tab[]
            ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
            //advance为true,可以继续迁移下一个节点,false则停止迁移
            boolean advance = true;
            //是否结束迁移
            boolean finishing = false; // to ensure sweep before committing nextTab
            //i是当前迁移位置的索引,bound是迁移的边界,是从后往前的顺序
            for (int i = 0, bound = 0;;) {
                Node<K,V> f; int fh;
                while (advance) {
                    int nextIndex, nextBound;
                    //while循环迁移的--(减减)条件,第一个条件一直为true,finishing为true则迁移任务结束
                    if (--i >= bound || finishing)
                        advance = false;
                    //transferIndex(上一次迁移的边界)赋值给nextIndex(必执行),这里transferIndex一旦小于等于0
                    //则说明原数组的所有位置的迁移都有相应的线程去处理了,该线程可以不用迁移了
                    else if ((nextIndex = transferIndex) <= 0) {
                        i = -1;
                        advance = false;
                    }
                    //将nextBound赋值给transferIndex,nextBound = nextIndex - stride(上一个边界减去步长)
                    //i = nextIndex - 1(上一个边界-1变成开始迁移的位置)
                    else if (U.compareAndSwapInt
                             (this, TRANSFERINDEX, nextIndex,
                              nextBound = (nextIndex > stride ?
                                           nextIndex - stride : 0))) {
                        bound = nextBound;
                        i = nextIndex - 1;
                        advance = false;
                    }
                }
                //i < 0说明所有迁移任务完成了
                if (i < 0 || i >= n || i + n >= nextn) {
                    int sc;
                    //所有迁移完成,将nextTable设为空,sizeCtl为新tab.length * 0.75
                    if (finishing) {
                        nextTable = null;
                        table = nextTab;
                        sizeCtl = (n << 1) - (n >>> 1);
                        return;
                    }
                    //该线程完成迁移,sizeCtl - 1,对应之前helpTransfer()中+1
                    if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                        //不相等说明还有其他线程没完成迁移,该线程结束任务
                        if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                            return;
                        //如果相等,则说明说有线程都完成任务了,设置finish为true
                        finishing = advance = true;
                        i = n; // recheck before commit
                    }
                }
                //如果旧tab[i]为null,则放入ForwardingNode
                else if ((f = tabAt(tab, i)) == null)
                    advance = casTabAt(tab, i, null, fwd);
                //如果该节点为ForwardingNode,则说明已经被迁移过了,就可以开始迁移下一个节点了
                else if ((fh = f.hash) == MOVED)
                    advance = true; // already processed
                else {
                    //迁移开始加锁,这部分和1.8HashMap差不多,将一条链表拆分成两条
                    //建议去看看1.8HashMap的扩容代码,好懂一点
                    synchronized (f) {
                        if (tabAt(tab, i) == f) {
                            Node<K,V> ln, hn;
                            //fh >= 0,说明是链表结构
                            //这个涉及到spread()方法,得到的hash值最高位必为0,则是正数
                            if (fh >= 0) {
                                int runBit = fh & n;
                                Node<K,V> lastRun = f;
                                for (Node<K,V> p = f.next; p != null; p = p.next) {
                                    int b = p.hash & n;
                                    if (b != runBit) {
                                        runBit = b;
                                        lastRun = p;
                                    }
                                }
                                if (runBit == 0) {
                                    ln = lastRun;
                                    hn = null;
                                }
                                else {
                                    hn = lastRun;
                                    ln = null;
                                }
                                for (Node<K,V> p = f; p != lastRun; p = p.next) {
                                    int ph = p.hash; K pk = p.key; V pv = p.val;
                                    if ((ph & n) == 0)
                                        ln = new Node<K,V>(ph, pk, pv, ln);
                                    else
                                        hn = new Node<K,V>(ph, pk, pv, hn);
                                }
                                setTabAt(nextTab, i, ln);
                                setTabAt(nextTab, i + n, hn);
                                //将该位置放入ForwardingNode
                                setTabAt(tab, i, fwd);
                                advance = true;
                            }
                            else if (f instanceof TreeBin) {
                                TreeBin<K,V> t = (TreeBin<K,V>)f;
                                TreeNode<K,V> lo = null, loTail = null;
                                TreeNode<K,V> hi = null, hiTail = null;
                                int lc = 0, hc = 0;
                                for (Node<K,V> e = t.first; e != null; e = e.next) {
                                    int h = e.hash;
                                    TreeNode<K,V> p = new TreeNode<K,V>
                                        (h, e.key, e.val, null, null);
                                    if ((h & n) == 0) {
                                        if ((p.prev = loTail) == null)
                                            lo = p;
                                        else
                                            loTail.next = p;
                                        loTail = p;
                                        ++lc;
                                    }
                                    else {
                                        if ((p.prev = hiTail) == null)
                                            hi = p;
                                        else
                                            hiTail.next = p;
                                        hiTail = p;
                                        ++hc;
                                    }
                                }
                                //一分为二后如果节点数小于树化阈值,则将红黑树转回链表
                                ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                    (hc != 0) ? new TreeBin<K,V>(lo) : t;
                                hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                    (lc != 0) ? new TreeBin<K,V>(hi) : t;
                                setTabAt(nextTab, i, ln);
                                setTabAt(nextTab, i + n, hn);
                                //将该位置放入ForwardingNode
                                setTabAt(tab, i, fwd);
                                //advance设置为true,说明该位置的迁移已经完成了
                                advance = true;
                            }
                        }
                    }
                }
            }
        }
    

    加锁部分的迁移逻辑:

    使用fn&n可以快速把链表中的元素区分成两类,A类是hash值的第X位为0,B类是hash值的第X位为1,并通过lastRun记录最后需要处理的节点,A类和B类节点可以分散到新数组的槽位14和30中,在原数组的槽位14中,蓝色节点第X为0,红色节点第X为1,把链表拉平显示如下:

    image

    1、通过遍历链表,记录runBitlastRun,分别为1和节点6,所以设置hn为节点6,ln为null;
    2、重新遍历链表,以lastRun节点为终止条件,根据第X位的值分别构造ln链表和hn链表:

    ln链:和原来链表相比,顺序已经不一样了

    image

    hn链:

    image

    通过CAS把ln链表设置到新数组的i位置,hn链表设置到i+n的位置;

    7、如果该槽位是红黑树结构,则构造树节点lohi,遍历红黑树中的节点,同样根据hash&n算法,把节点分为两类,分别插入到lohi为头的链表中,根据lohi链表中的元素个数分别生成lnhn节点,其中ln节点的生成逻辑如下:
    (1)如果lo链表的元素个数小于等于UNTREEIFY_THRESHOLD,默认为6,则通过untreeify方法把树节点链表转化成普通节点链表;
    (2)否则判断hi链表中的元素个数是否等于0:如果等于0,表示lo链表中包含了所有原始节点,则设置原始红黑树给ln,否则根据lo链表重新构造红黑树。
    https://www.jianshu.com/p/f6730d5784ad
    https://blog.csdn.net/b410604224/article/details/91345265

    三、扩容的影响,可优化

    1. 影响正常put等操作
    2. get时候可以从新旧两个数组取。
    3. 带参初始化,避免扩容

    四、对比Redis的扩容

    Redis的扩容是维护了一个rehashidx,每次CRUD的时候都迁移一个节点,然后rehashidx+1,这样的好处是避免了大规模扩容,导致的阻塞,而ConcurrentHashMap没有采用这样的方式,主要原因还是能够多线程扩容,充分利用CPU资源,当put、get、remove的时候都会增加一个线程扩容。但是大规模扩容也会引起阻塞

    相关文章

      网友评论

          本文标题:ConcurrentHashMap的扩容

          本文链接:https://www.haomeiwen.com/subject/scfboktx.html