美文网首页
Java集合之HashMap底层实现原理[2]

Java集合之HashMap底层实现原理[2]

作者: walton_wang | 来源:发表于2020-06-13 19:04 被阅读0次

Java集合之HashMap底层实现原理[1]
前面分析了下jdk 1.7的hashMap底层结构,今天在来说下jdk 1.8的HashMap底层实现,和1.7对比,有哪些不同的地方;

目录如下:

1、底层结构

2、扩容机制

3、线程安全问题


底层结构

同1.7的不同,1.8的底层结构是数组+链表+红黑树;
当链表的长度小于8时且数组的长度不大于64,结构和1.7是一样,相反,会将链表转换为红黑树;
引入红黑树好处:提高了查询的效率,时间复杂度为O(logn);
在1.7 链表插入:头插法,而1.8 改为尾插法,这样可以避免扩容导致的死循环问题;

  • 先来看下put方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        // 初始实例化时,数组为空,赋值初始参数(threshold,cap等)
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //  根据(数组长度-1)& key(hash) 获取该数组下标数据为空,则添加节点
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            // 比较key和hash,相同把旧值赋值给变量e
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            // 如果该链表节点是树节点,则向树节点插入数据    
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                // 遍历链表,如果链表长度>=8,则将普通节点转为红黑树
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st                            
                       // 具体红黑树的转换代码
                        treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            // 省略、、、
        }
        ++modCount;
        // 如果数组长度等于阀值,则扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }
  • treeifyBin 转换树节点
final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
    // 如果数组为空或者长度小于64,则进行扩容
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
        resize();
    // 如果数组长度大于64,且根据index获取节点不为空,则进行红黑树转换  
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        TreeNode<K,V> hd = null, tl = null;
        do {
           // 先将Node节点转为 TreeNode
            TreeNode<K,V> p = replacementTreeNode(e, null);
            if (tl == null)
                hd = p;// 树的第一个节点赋值为头节点
            else {
                //给当前节点指向前一个节点和后一个节点
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        if ((tab[index] = hd) != null)
            // 转换后的树节点,进行节点的平衡
            hd.treeify(tab);
    }
}
  • treeify平衡树节点(红黑树)
final void treeify(Node<K,V>[] tab) {
    TreeNode<K,V> root = null; // 定义根节点
    for (TreeNode<K,V> x = this, next; x != null; x = next) {
        next = (TreeNode<K,V>)x.next;
        x.left = x.right = null;
        // 根节点定义为黑色,赋值为root
        if (root == null) {
            x.parent = null;
            x.red = false;
            root = x;
        }
        else {
            /*
             *如果根节点不为空,通过比较hash值
             * 1、根节点 ph > 节点x h,dir = -1,放入左节点
             * 2、根节点 ph < 节点x h,dir = 1,放入右节点
             * 3、根节点 ph = 节点x,hash冲突,此时调用comparableClassFor(),
             *    判断key是否实现Comparable,如果kc != null,继续调用compareComparables()比较;
             *    如果dir = 0;则调用 tieBreakOrder()比较
             */
            K k = x.key;
            int h = x.hash;
            Class<?> kc = null;
            for (TreeNode<K,V> p = root;;) {
                int dir, ph;
                K pk = p.key;
                if ((ph = p.hash) > h)
                    dir = -1;
                else if (ph < h)
                    dir = 1;
                else if ((kc == null &&
                          (kc = comparableClassFor(k)) == null) ||
                         (dir = compareComparables(kc, k, pk)) == 0)
                    dir = tieBreakOrder(k, pk);
                // dir <=0 ,放入根节点的左节点,相反,放入根节点的右节点;
                TreeNode<K,V> xp = p;
                if ((p = (dir <= 0) ? p.left : p.right) == null) {
                    x.parent = xp;
                    if (dir <= 0)
                        xp.left = x;
                    else
                        xp.right = x;
                    // 平衡红黑树,里面代码省略,另写博客分析  
                    root = balanceInsertion(root, x);
                    break;
                }
            }
        }
    }
    // 判断当前root是否为该树的根节点
    moveRootToFront(tab, root);
}

扩容机制

其扩容调用的resize(),该方法包含初始化或扩容的实现;
看代码具体实现方式

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        // 如果原数组不为空,且数组容量大于允许的最大值时,不进行扩容,阀值等于2^31-1,直接返回原数组
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        /** 
         * 走到这步,原数组容量小于最大值,当对原数组扩容为2倍后且原数组容量大于等于默认初始容量时
         * 则新的阀值=原阀值 << 1 (原容量>=16,意味着构造函数时指定初始容量或者已经进行了一次扩容操作)
         **/
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    // 原数组容量为空,原阀值大于0,说明构造函数时指定的初始容量;
    // 将新容量 = 原阀值
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               
         // zero initial threshold signifies using defaults
         // 调用无惨构造函数构造map,初始添加元素
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 明构造函数时指定的初始容量,新阀值 = 新容量 * 加载因子(新容量和新阀值在允许范围内,若不满足条件返回Integer.MAX_VALUE)
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; //定义新的数组并指定新的容量大小
    table = newTab;
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e; // 计算新数组中的下标,将原节点放入新数组
                else if (e instanceof TreeNode) // 如果原节点是树节点,则执行切割,这个单独写博客说明
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    /**
                     * 这里面 lo和hi,暂且根据名称解释:loHead/loTail[低头尾节点] hiHead/hiTail[高头尾节点]
                     * 数组的扩容大小为原来的2倍,当节点的hash与原容量取模运算结果为0时,因为容量大小为2的N次方,参与运算的有效二进制位的高位肯定为1,
                     * 比如16的二进制为10000,取模结果为0,则hash的有效二进制位的高位肯定为0,只有*..0**** 和 10000 进行与运算结果才为00000(*..表示不确定的多个二进制位)
                     * 数组定位下标的运算:hash & (len[数组长度] - 1),例如:下标 = (*..0**** & 1111) 等同于 (*..0**** & 11111) 。1111是15的二进制、11111是31的二进制,也就是2倍扩容
                     * 所以当该hash值与新的容量取模运算后,与原容量是相同的,也就是说该元素的下标位置不变
                     **/
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e; // 链表为空时,头节点指向该元素
                            else
                                loTail.next = e; // 如果有尾,那么链表不为空,把该元素挂到链表的最后
                            loTail = e; // 把尾节点设置为当前元素
                        }
                        else {
                            // 如果与运算结果不为0,说明hash值大于老数组长度(例如hash值为17)
                            // 此时该元素应该放置到新数组的高位位置上 
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead; // 低位的元素组成的链表还是放置在原来的位置
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead; // 高位的元素组成的链表位置是在原有位置上偏移了老数组的长度
                    }
                }
            }
        }
    }
    return newTab;
}

线程安全

HashMap没有针对多线程环境下做线程安全处理,所以避免在非线程安全的情况下使用hashMap,可以用ConcurrentHashMap来实现;如果在非线程安全的情况下使用了hashMap,可能导致数据不一致的问题

总结

1、同jdk7相比,jdk8增加了红黑树的概念,当链表的长度大于8的时候,会将链表转为红黑树;整个数据结构是单向链表和红黑树是共存的;
2、引入红黑树,对于查找,增加和删除节点的效率都提高很多;
3、计算hash方面,jdk8通过高低位都参与的位运算,增加了随机性,这样性能会更好,效率更高;

相关文章

网友评论

      本文标题:Java集合之HashMap底层实现原理[2]

      本文链接:https://www.haomeiwen.com/subject/clsatktx.html