java源码分析之HashMap (二)

作者: dafasoft | 来源:发表于2019-12-03 21:12 被阅读0次

java源码分析之LinkedHashMap
java源码分析之HashMap（三）
Java 集合类原理
JAVA 8 HashMap 源码分析
Java基础之LinkedList源码解析
Java基础之ArrayList源码解析
Java基础之HashTable源码解析
面试准备
Java基础之LinkedHashMap源码解析
HashMap剖析

相关文章
java源码分析之HashMap (一)

上一篇博文主要介绍了HashMap链表结构的实现，本篇继续分析HashMap树形结构的实现。

树形桶的节点结构

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
// 代码省略
}

TreeNode是树形结构的基本节点，它继承自LinkedHashMap.Entry类，我们看一下具体的实现

static class Entry<K,V> extends HashMap.Node<K,V> {
        Entry<K,V> before, after;
        Entry(int hash, K key, V value, Node<K,V> next) {
            super(hash, key, value, next);
        }
    }

从以上代码我们可以看到，TreeNode是个红黑树的节点，Entry是个双向链表的节点，由此我们我们可以大胆猜测一下，如果一个桶的结构是树形结构，那么它应该是红黑树+双向链表的集合体，下面我们就来分析+验证这个猜测。

树形桶的生成

我们看一下putVal()方法：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

我们从第19行开始看
这一句的判断条件的意思是当某个桶内的元素大于等于TREEIFY_THRESHOLD这个值时，会把桶的链表结构转换为树形结构，我们继续分析treeifyBin()方法：

final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            // table的长度大于MIN_TREEIFY_CAPACITY时才会有执行树化操作，否则只是扩容
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

我们看第三行代码，从这一行代码的判断条件可以得出结论：只有在桶的个数大于等于MIN_TREEIFY_CAPACITY个时，才会执行树化操作，否则只是扩容，由此我们可以得出如下结论：
HashMap将链表结构转化为树形结构有两个条件:
1.单个桶中节点个数大于等于TREEIFY_THRESHOLD（默认值为8）
2.table长度大于等于MIN_TREEIFY_CAPACITY（默认值为64）
继续分析 treeifyBin(Node<K,V>[] tab, int hash) 方法，我们可以看到在接下来的do-while循环只是将目标桶内的单向链表结构转化为了双向链表结构，那么真正转为树形结构的操作在哪里呢？答案很明显，就是在hd.treeify(tab);这一行，我们继续跟下去。

final void treeify(Node<K,V>[] tab) {
            TreeNode<K,V> root = null;
            for (TreeNode<K,V> x = this, next; x != null; x = next) {
                next = (TreeNode<K,V>)x.next;
                x.left = x.right = null;
                if (root == null) {
                    x.parent = null;
                    x.red = false;
                    root = x;
                }
                else {
                    K k = x.key;
                    int h = x.hash;
                    Class<?> kc = null;
                    for (TreeNode<K,V> p = root;;) {
                        int dir, ph;
                        K pk = p.key;
                        if ((ph = p.hash) > h)
                            dir = -1;
                        else if (ph < h)
                            dir = 1;
                        else if ((kc == null &&
                                  (kc = comparableClassFor(k)) == null) ||
                                 (dir = compareComparables(kc, k, pk)) == 0)
                            dir = tieBreakOrder(k, pk);

                        TreeNode<K,V> xp = p;
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            x.parent = xp;
                            if (dir <= 0)
                                xp.left = x;
                            else
                                xp.right = x;
                            root = balanceInsertion(root, x);
                            break;
                        }
                    }
                }
            }
            moveRootToFront(tab, root);
        }

从代码可以看出，这其实就是把链表转化为红黑树的逻辑，关于红黑树我们后面再讲，现在只需要知道红黑树是一个平衡二叉查找树即可,而且综合之前的分析，我们可以看到其实TreeNode既是一个红黑树结构，又是一个双链表结构。
既然有treeify方法，那么相对的就会有unTreeify方法，我们来看一下：

final Node<K,V> untreeify(HashMap<K,V> map) {
            Node<K,V> hd = null, tl = null;
            for (Node<K,V> q = this; q != null; q = q.next) {
                Node<K,V> p = map.replacementNode(q, null);
                if (tl == null)
                    hd = p;
                else
                    tl.next = p;
                tl = p;
            }
            return hd;
        }

方法的实现很简单，就是遍历红黑树把TreeNode节点转化为Node节点，也就是把红黑树+双向链表的数据结构转化为单向链表结构。
那么这个unTreeify方法是在哪里调用的呢？有两个地方，一个是removeTreeNode方法，一个是split方法，我们首先看removeTreeNode方法：

final void removeTreeNode(HashMap<K,V> map, Node<K,V>[] tab,
                                  boolean movable) {
            int n;
            if (tab == null || (n = tab.length) == 0)
                return;
            int index = (n - 1) & hash;
            TreeNode<K,V> first = (TreeNode<K,V>)tab[index], root = first, rl;
            TreeNode<K,V> succ = (TreeNode<K,V>)next, pred = prev;
            if (pred == null)
                tab[index] = first = succ;
            else
                pred.next = succ;
            if (succ != null)
                succ.prev = pred;
            if (first == null)
                return;
            if (root.parent != null)
                root = root.root();
            if (root == null
                || (movable
                    && (root.right == null
                        || (rl = root.left) == null
                        || rl.left == null))) {
                tab[index] = first.untreeify(map);  // too small
                return;
            }
            // 代码省略
        }

代码很长，且大部分和红黑树的节点删除有关，我们把无关的代码省略，重点看一下untreeify执行的条件

条件.jpg

我们来分析分析上面这个逻辑，进入这个untreeify() 的要求是，root == null, root.right ==null, root.left==null, root.left.left==null四种情况，我们以7个节点的红黑树来分析，A为root节点。

七节点红黑树.png

所以进入这个方法主要有以下几种情况，我们一种一种的来分析当满足要求时，节点的个数。（这里默认认为知道红黑树的5个特点，主要是黑平衡）

当这四种情况都满足时，我们可以看出最多节点有如上图所示个数，可以为7个。（大于8个不考虑，因为大于8会变成红黑树）。

1.　　最多节点情况：当我们删除节点D时，只满足root.left.left==null这个条件，这棵树仍可以维持红黑树的特点，这时的最大节点数为6.

2.　　最少节点情况：当EFG不存在时，在A,B,C,D中删除任意一个节点，都会满足上述四种规则中的一种。则存在最少节点情况，有3个节点。

以上情况都是会将树转化成链表，此时的节点是 3<= nodes <=6 ，由此可以看出，当节点数在小于6时，是可能转化成链表，但不是绝对情况，所以使用定义的变量（固定数量6）也不正确。只好通过判断去动态获取节点数。

节点数量原因分析　　
　　为什么在小于6的时候可能转换成链表，而在大于8的时候转化成红黑树？

主要通过时间查询节点分析，红黑树的平均查询时间为 log(n), 而链表是O(n)，平均是O(n)/2。

当节点数为8时，红黑树查询时间3，链表查询时间是4, 可以看出来当红黑树查询效率大于了链表。（两个函数曲线问题，当节点更多是，比红黑树需要的时间更多）

当节点数为6时，为什么转换成链表，我认为主要时因为节点数太少，如果还是用红黑树，为了维持红黑树的特点，则需要翻转，左旋，右旋，等，更消耗性能。

为什么不是7是转化？
　　　　主要是为了给一个过渡，防止频繁转化。也如上图，7个节点可能正好是一个满二叉树。
接下来看split方法：

final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
            TreeNode<K,V> b = this;
            // Relink into lo and hi lists, preserving order
            TreeNode<K,V> loHead = null, loTail = null;
            TreeNode<K,V> hiHead = null, hiTail = null;
            int lc = 0, hc = 0;
            for (TreeNode<K,V> e = b, next; e != null; e = next) {
                next = (TreeNode<K,V>)e.next;
                e.next = null;
                if ((e.hash & bit) == 0) {
                    if ((e.prev = loTail) == null)
                        loHead = e;
                    else
                        loTail.next = e;
                    loTail = e;
                    ++lc;
                }
                else {
                    if ((e.prev = hiTail) == null)
                        hiHead = e;
                    else
                        hiTail.next = e;
                    hiTail = e;
                    ++hc;
                }
            }

            if (loHead != null) {
                if (lc <= UNTREEIFY_THRESHOLD)
                    tab[index] = loHead.untreeify(map);
                else {
                    tab[index] = loHead;
                    if (hiHead != null) // (else is already treeified)
                        loHead.treeify(tab);
                }
            }
            if (hiHead != null) {
                if (hc <= UNTREEIFY_THRESHOLD)
                    tab[index + bit] = hiHead.untreeify(map);
                else {
                    tab[index + bit] = hiHead;
                    if (loHead != null)
                        hiHead.treeify(tab);
                }
            }
        }

这个方法的调用是在resize方法中，结合我们上一篇讲过的链表结构resize的操作，这里的逻辑就不难理解了，其实就是把一个桶的树形结构拆分成高低位两个桶，如果低位的桶不适用红黑树的结构了，就调用unTreeify方法转化为链表结构。

java源码分析之LinkedHashMap
相关文章java源码分析之HashMap（一）java源码分析之HashMap（二）java源码分析之HashMa...
java源码分析之HashMap（三）
相关文章java源码分析之HashMap（一）java源码分析之HashMap（二）https://blog.cs...
Java 集合类原理
Java基础——HashMap源码分析 Java基础——HashSet源码分析 Java基础——HashTable...
JAVA 8 HashMap 源码分析
JAVA 8 HashMap 源码分析一什么是HashMap？ HashMap 继承了AbstractMap,...
Java基础之LinkedList源码解析
Java集合源码解析系列 Java基础之HashMap源码解析 Java基础之LinkedHashMap源码解析 ...
Java基础之ArrayList源码解析
Java集合源码解析系列 Java基础之HashMap源码解析 Java基础之LinkedHashMap源码解析 ...
Java基础之HashTable源码解析
Java集合源码解析系列 Java基础之HashMap源码解析 Java基础之LinkedHashMap源码解析 ...
面试准备
1.HashMap && CurrentHashMap源码分析 HashMap源码解析 java 并发编程之 Co...
Java基础之LinkedHashMap源码解析
Java集合源码解析系列 Java基础之HashMap源码解析 Java基础之HashTable源码解析 Java...
HashMap剖析
Java集合：HashMap源码剖析一、HashMap概述二、HashMap的数据结构三、HashMap源码...