美文网首页Java
聊聊java中的哪些Map:(九)TreeMap源码分析

聊聊java中的哪些Map:(九)TreeMap源码分析

作者: 冬天里的懒喵 | 来源:发表于2020-09-02 18:51 被阅读0次

[toc]

java中还有一个有序的Map是TreeMap,虽然相对于HashMap,其出镜率并不高,但是我们在某些场景下也会用到,另外这个TreeMap完全是基于红黑树的一种实现,分析其源码有利于对红黑树概念的理解。

1.类结构及其成员变量

1.1 类结构

TreeMap的类继承结构如下图:


image.png

可以看到,TreeMap继承了AbstractMap,此外实现了NavigableMap、Cloneable和Serializable接口。而NavigableMap接口又继承了SortedMap。这与ConcurrentSkipListMap的情况类似,因而也是有序的。

/**
 * A Red-Black tree based {@link NavigableMap} implementation.
 * The map is sorted according to the {@linkplain Comparable natural
 * ordering} of its keys, or by a {@link Comparator} provided at map
 * creation time, depending on which constructor is used.
 *
 * <p>This implementation provides guaranteed log(n) time cost for the
 * {@code containsKey}, {@code get}, {@code put} and {@code remove}
 * operations.  Algorithms are adaptations of those in Cormen, Leiserson, and
 * Rivest's <em>Introduction to Algorithms</em>.
 *
 * <p>Note that the ordering maintained by a tree map, like any sorted map, and
 * whether or not an explicit comparator is provided, must be <em>consistent
 * with {@code equals}</em> if this sorted map is to correctly implement the
 * {@code Map} interface.  (See {@code Comparable} or {@code Comparator} for a
 * precise definition of <em>consistent with equals</em>.)  This is so because
 * the {@code Map} interface is defined in terms of the {@code equals}
 * operation, but a sorted map performs all key comparisons using its {@code
 * compareTo} (or {@code compare}) method, so two keys that are deemed equal by
 * this method are, from the standpoint of the sorted map, equal.  The behavior
 * of a sorted map <em>is</em> well-defined even if its ordering is
 * inconsistent with {@code equals}; it just fails to obey the general contract
 * of the {@code Map} interface.
 *
 * <p><strong>Note that this implementation is not synchronized.</strong>
 * If multiple threads access a map concurrently, and at least one of the
 * threads modifies the map structurally, it <em>must</em> be synchronized
 * externally.  (A structural modification is any operation that adds or
 * deletes one or more mappings; merely changing the value associated
 * with an existing key is not a structural modification.)  This is
 * typically accomplished by synchronizing on some object that naturally
 * encapsulates the map.
 * If no such object exists, the map should be "wrapped" using the
 * {@link Collections#synchronizedSortedMap Collections.synchronizedSortedMap}
 * method.  This is best done at creation time, to prevent accidental
 * unsynchronized access to the map: <pre>
 *   SortedMap m = Collections.synchronizedSortedMap(new TreeMap(...));</pre>
 *
 * <p>The iterators returned by the {@code iterator} method of the collections
 * returned by all of this class's "collection view methods" are
 * <em>fail-fast</em>: if the map is structurally modified at any time after
 * the iterator is created, in any way except through the iterator's own
 * {@code remove} method, the iterator will throw a {@link
 * ConcurrentModificationException}.  Thus, in the face of concurrent
 * modification, the iterator fails quickly and cleanly, rather than risking
 * arbitrary, non-deterministic behavior at an undetermined time in the future.
 *
 * <p>Note that the fail-fast behavior of an iterator cannot be guaranteed
 * as it is, generally speaking, impossible to make any hard guarantees in the
 * presence of unsynchronized concurrent modification.  Fail-fast iterators
 * throw {@code ConcurrentModificationException} on a best-effort basis.
 * Therefore, it would be wrong to write a program that depended on this
 * exception for its correctness:   <em>the fail-fast behavior of iterators
 * should be used only to detect bugs.</em>
 *
 * <p>All {@code Map.Entry} pairs returned by methods in this class
 * and its views represent snapshots of mappings at the time they were
 * produced. They do <strong>not</strong> support the {@code Entry.setValue}
 * method. (Note however that it is possible to change mappings in the
 * associated map using {@code put}.)
 *
 * <p>This class is a member of the
 * <a href="{@docRoot}/../technotes/guides/collections/index.html">
 * Java Collections Framework</a>.
 *
 * @param <K> the type of keys maintained by this map
 * @param <V> the type of mapped values
 *
 * @author  Josh Bloch and Doug Lea
 * @see Map
 * @see HashMap
 * @see Hashtable
 * @see Comparable
 * @see Comparator
 * @see Collection
 * @since 1.2
 */

public class TreeMap<K,V>
    extends AbstractMap<K,V>
    implements NavigableMap<K,V>, Cloneable, java.io.Serializable
{
}

其注释大意为:
TreeMap是一个基于红黑树的NavigableMap实现,可以根据Comparable实现自然排序,或者Comparator排序,至于根据哪个排序取决于构造函数。
这个实现对containsKey、get、put、remove提供了恒定的时间复杂度log(n)。这个算法是对Cormen、Leiserson和Rivest算法的改进。
请注意,TreeMap与任何排序的map一样,维护的顺序,以及是否提供显示比较必须与equals方法一致,以便排序的map能够正确实现。之所以这样,是因为map接口是根据equals的操作定义的,但是排序之后的map使用compareTo或者compare方法执行比较,因此从排序map的角度来看,此方法认为相等的两个key是相等的。排序后的map的行为是明确定义的,即使其排序与equals不一致,它也只是无法遵守map的一般约定。
需要注意的是,这个实现是非同步的。如果多线程并发访问,最后一个线程修改了这个map的结构,它必须在外部进行同步。结构的修改是指添加或者删除一个或者多个映射。使用key进行更新不是属于结构修改。这是通常通过封装TreeMap对象来实现。
如果这个对象不存在,那么应该使用Collections.synchronizedSortedMap方法。最好是在创建的时候完成,以防止不同步的访问。如下:

SortedMap m = Collections.synchronizedSortedMap(new TreeMap(...));

这个类的所有集合视图方法返回的集合的iterator的迭代器都是fail-fast的。如果在迭代器被映射之后的任何时间对结构进行修改,除非通过迭代器自己的remove方法,否则将抛出ConcurrentModificationException,因此,面对并发修改,迭代器将快速失败,而不是冒着未来不确定的时间产生任意不确定的风险。
注意,迭代器的fail-fast并不是一个担保的行为,因为通常来说,存在不同步修改的并发修改的情况下,不可能做出任何严格的保证,快速失败的迭代器将会最大努力的抛出ConcurrentModificationException。因此,编写任何依赖于此异常的程序代码以确保其正确性都是错误的。迭代器的快速失败机制仅仅用于检测错误。
此类中的方法返回的所有Entry对其视图均表示生成map的快照,他们不支持Entry.setValue方法,不过请注意,可以使用put更改关联map中的映射。
另外,TreeMap还是java集合框架的成员。

1.2 成员变量

由于TreeMap并不涉及线程安全和扩容,因此成员变量非常简单:

/**
 * The comparator used to maintain order in this tree map, or
 * null if it uses the natural ordering of its keys.
 *
 * @serial
 */
private final Comparator<? super K> comparator;

private transient Entry<K,V> root;

/**
 * The number of entries in the tree
 */
private transient int size = 0;

/**
 * The number of structural modifications to the tree.
 */
private transient int modCount = 0;

comparator 是用于进行比较的比较器。root指向根节点,由于红黑树是一个树形结构,因此不再需要数组之类的结构来存储。size用于存放tree中元素的长度。modCount则是在fail-fast机制所依赖的。

2. 核心内部类Entry

TreeMap是基于红黑树的数据结构,TreeMap实现了Map.Entry接口。具有key、value、left、right、parent等属性。

static final class Entry<K,V> implements Map.Entry<K,V> {
    K key;
    V value;
    Entry<K,V> left;
    Entry<K,V> right;
    Entry<K,V> parent;
    boolean color = BLACK;

    /**
     * Make a new cell with given key, value, and parent, and with
     * {@code null} child links, and BLACK color.
     */
    Entry(K key, V value, Entry<K,V> parent) {
        this.key = key;
        this.value = value;
        this.parent = parent;
    }

    /**
     * Returns the key.
     *
     * @return the key
     */
    public K getKey() {
        return key;
    }

    /**
     * Returns the value associated with the key.
     *
     * @return the value associated with the key
     */
    public V getValue() {
        return value;
    }

    /**
     * Replaces the value currently associated with the key with the given
     * value.
     *
     * @return the value associated with the key before this method was
     *         called
     */
    public V setValue(V value) {
        V oldValue = this.value;
        this.value = value;
        return oldValue;
    }

    public boolean equals(Object o) {
        if (!(o instanceof Map.Entry))
            return false;
        Map.Entry<?,?> e = (Map.Entry<?,?>)o;

        return valEquals(key,e.getKey()) && valEquals(value,e.getValue());
    }

    public int hashCode() {
        int keyHash = (key==null ? 0 : key.hashCode());
        int valueHash = (value==null ? 0 : value.hashCode());
        return keyHash ^ valueHash;
    }

    public String toString() {
        return key + "=" + value;
    }
}

这个类的结构也非常简单,需要注意的是,其hashCode方法,实际上是keyHash ^ valueHash。虽然key和value都不支持为空,但是还做了特殊处理。

3.基本原理之红黑树

在要搞懂红黑树之前,我们需要先弄清楚,二叉搜索树(Binary Search Tree)和平衡二叉树(AVL树)是什么,之后再来理解红黑树(RB树)。

3.1 二叉搜索树(Binary Search Tree)

定义:它或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值; 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值; 它的左、右子树也分别为二叉排序树。
二叉搜索树的概念看起来复杂,实际上非常简单,要求就一个,任意节点,其值大于左节点,小于右节点。
如下就是一个二叉搜索树:


二叉搜索树

如果这个二叉搜索树比较平衡的话,其查找的时间复杂度为(log n)。
但是需要注意的是,二叉搜索树如果使用不当非常容易退化为链表,导致时间复杂度退化为n。为了解决这个问题,就出现了平衡二叉树(AVL树)。

3.2 平衡二叉树(AVL Tree)

平衡二叉树实际上是二叉搜索树的一种特殊情况。但是其带有平衡条件。要求每个节点的左右子树的高度绝对值最多为1(平衡因子)。
平衡二叉树通过一系列平衡操作,左旋、右旋等,来保证了平衡二叉树的平衡性。


平衡二叉树

这样就将查询的时间复杂度恒定在(log n)。但是代价就是在插入和删除的时候会带来非常高的时间消耗。将插入和删除的时间复杂度都变成了(log n)。

3.3 红黑树

红黑树是平衡二叉树的一个变种,其也是在二叉搜索树上进化而来,但是其转置是根据红黑标记而来。而不是像平衡二叉树那样做统一的要求。其平衡性相对平衡二叉树要低。颜色规则为:

  • 1.任意节点的颜色要么黑色,要么红色。
  • 2.根节点是黑色。
  • 3.如果一个节点为红色,其子节点一定是黑色。(不能允许有两个连续向连的红色节点)
  • 4.任意节点到其下面的空节点,(空接点为黑色)。的路径上,黑色节点的数量相同。
    通过从根节点到空节点的任意路径进行颜色约束,红黑树可以确保没用一条路径比其他路径的长度多出2倍。因此红黑树是一个近似平衡的树。(节点的平衡因子不能大于1)


    红黑树

红黑树是一个近似平衡的二叉树。也是采用旋转的方式来实现。但是由于其的近似特性,不用旋转到AVL树那种完全平衡的二叉树。AVL树一定是保证左边节点都是满的,如果存在不满的情况一定会出现在右侧。因此AVL树要保证平衡性,旋转的过程会更加复杂,耗时会更长。
实际上这也是大多数集合框架底层采用红黑树的原因。其插入和删除的效率高于AVL数,但是检索效率不会低多少。

4.构造函数

4.1 TreeMap()

支持空的构造函数:

public TreeMap() {
    comparator = null;
}

4.2 TreeMap(Comparator<? super K> comparator)

public TreeMap(Comparator<? super K> comparator) {
    this.comparator = comparator;
}

此方法只是传入了一个比较器。

4.3 TreeMap(Map<? extends K, ? extends V> m)

从其他map中put

public TreeMap(Map<? extends K, ? extends V> m) {
    comparator = null;
    putAll(m);
}

内部通过putAll方法实现。

public void putAll(Map<? extends K, ? extends V> map) {
    int mapSize = map.size();
    if (size==0 && mapSize!=0 && map instanceof SortedMap) {
        Comparator<?> c = ((SortedMap<?,?>)map).comparator();
        if (c == comparator || (c != null && c.equals(comparator))) {
            ++modCount;
            try {
                buildFromSorted(mapSize, map.entrySet().iterator(),
                                null, null);
            } catch (java.io.IOException cannotHappen) {
            } catch (ClassNotFoundException cannotHappen) {
            }
            return;
        }
    }
    super.putAll(map);
}

如果为SortedMap的子类,则通过Sorted的方法实现。buildFromSorted。反之则通过父类的方法,遍历之后再插入。

4.4 TreeMap(SortedMap<K, ? extends V> m)

public TreeMap(SortedMap<K, ? extends V> m) {
    comparator = m.comparator();
    try {
        buildFromSorted(m.size(), m.entrySet().iterator(), null, null);
    } catch (java.io.IOException cannotHappen) {
    } catch (ClassNotFoundException cannotHappen) {
    }
}

通过buildFromSorted 实现sorted的插入。

5.重要方法

下面对TreeMap的一些重要方法的源码进行分析:

5.1 get

get方法:

public V get(Object key) {
    Entry<K,V> p = getEntry(key);
    return (p==null ? null : p.value);
}

实际上调用的是getEntry方法 :

final Entry<K,V> getEntry(Object key) {
    // Offload comparator-based version for sake of performance
    //如果比较器为空
    if (comparator != null)
        return getEntryUsingComparator(key);
    //如果key为空 则返回NPE异常 key不支持为空
    if (key == null)
        throw new NullPointerException();
    @SuppressWarnings("unchecked")
       //key是可比较的
        Comparable<? super K> k = (Comparable<? super K>) key;
    Entry<K,V> p = root;
    //如果不为空则根据比较结果左右遍历
    while (p != null) {
        int cmp = k.compareTo(p.key);
        //小于0则左树遍历
        if (cmp < 0)
            p = p.left;
        //大于0则右树遍历
        else if (cmp > 0)
            p = p.right;
        else
            return p;
    }
    return null;
}

5.2 put

put源码:

public V put(K key, V value) {
    Entry<K,V> t = root;
    //t为root节点,如果t为空
    if (t == null) {
        //可比较性校验
        compare(key, key); // type (and possibly null) check
        //直接在root节点创建
        root = new Entry<>(key, value, null);
        //增加计数器和modCount
        size = 1;
        modCount++;
        return null;
    }
    int cmp;
    Entry<K,V> parent;
    // split comparator and comparable paths
    //比较器
    Comparator<? super K> cpr = comparator;
    if (cpr != null) {
       //如果比较器不为空则循环遍历
        do {
            parent = t;
            //比较
            cmp = cpr.compare(key, t.key);
            //小于0左树遍历
            if (cmp < 0)
                t = t.left;
            //大于0右树遍历
            else if (cmp > 0)
                t = t.right;
            //反之则直接修改值
            else
                return t.setValue(value);
        } while (t != null);
    }
    else {
    //如果key为空 则NPE异常
        if (key == null)
            throw new NullPointerException();
        @SuppressWarnings("unchecked")
            Comparable<? super K> k = (Comparable<? super K>) key;
        //反之循环遍历
        do {
            parent = t;
            cmp = k.compareTo(t.key);
            //左树遍历
            if (cmp < 0)
                t = t.left;
            //右树遍历
            else if (cmp > 0)
                t = t.right;
            //反之直接设置值
            else
                return t.setValue(value);
        } while (t != null);
    }
    Entry<K,V> e = new Entry<>(key, value, parent);
    if (cmp < 0)
        parent.left = e;
    else
        parent.right = e;
    //之后进行插入之后的平衡操作
    fixAfterInsertion(e);
    size++;
    modCount++;
    return null;
}

上述即是put方法。

5.3 remove

reomve方法源码如下:

public V remove(Object key) {
   //通过get方法找到p
    Entry<K,V> p = getEntry(key);
    //如果p为null则没找到 直接返回null
    if (p == null)
        return null;
    //将oldValue存储并返回,然后通过deleteEntry删除节点
    V oldValue = p.value;
    deleteEntry(p);
    return oldValue;
}

操作逻辑在deleteEntry中:

private void deleteEntry(Entry<K,V> p) {
    //增加modCount次数和减少size
    modCount++;
    size--;

    // If strictly internal, copy successor's element to p and then make p
    // point to successor.
    //如果左右都不为空 
    if (p.left != null && p.right != null) {
       //后继节点 左右和父节点三个节点进行判断 按这个顺序取 之后将p的key和value改为后继节点
        Entry<K,V> s = successor(p);
        p.key = s.key;
        p.value = s.value;
        //将p和后继节点合并
        p = s;
    } // p has 2 children

    // Start fixup at replacement node, if it exists.
    //替换节点 p的左 右 只要不为空 按这个次序
    Entry<K,V> replacement = (p.left != null ? p.left : p.right);
    //如果还有替换节点
    if (replacement != null) {
        // Link replacement to parent
        //将p的parent指向这个节点
        replacement.parent = p.parent;
        //如果parent为null 则将root指向它
        if (p.parent == null)
            root = replacement;
        else if (p == p.parent.left)
            p.parent.left  = replacement;
        else
            p.parent.right = replacement;

        // Null out links so they are OK to use by fixAfterDeletion.
        //将p的指征都清空 以便GC回收
        p.left = p.right = p.parent = null;

        //颜色检测
        // Fix replacement
        if (p.color == BLACK)
            fixAfterDeletion(replacement);
    } else if (p.parent == null) { // return if we are the only node.
        root = null;
    } else { //  No children. Use self as phantom replacement and unlink.
        if (p.color == BLACK)
        //平衡操作
            fixAfterDeletion(p);

        if (p.parent != null) {
            if (p == p.parent.left)
                p.parent.left = null;
            else if (p == p.parent.right)
                p.parent.right = null;
            p.parent = null;
        }
    }
}

5.4 fixAfterInsertion

这是在insert之后,进行红黑树颜色校验:

 /** From CLR */
private void fixAfterInsertion(Entry<K,V> x) {
    //先将x的颜色改为红色
    x.color = RED;
    //之后遍历循环
    while (x != null && x != root && x.parent.color == RED) {
        if (parentOf(x) == leftOf(parentOf(parentOf(x)))) {
            Entry<K,V> y = rightOf(parentOf(parentOf(x)));
            if (colorOf(y) == RED) {
                setColor(parentOf(x), BLACK);
                setColor(y, BLACK);
                setColor(parentOf(parentOf(x)), RED);
                x = parentOf(parentOf(x));
            } else {
                if (x == rightOf(parentOf(x))) {
                    x = parentOf(x);
                    rotateLeft(x);
                }
                setColor(parentOf(x), BLACK);
                setColor(parentOf(parentOf(x)), RED);
                rotateRight(parentOf(parentOf(x)));
            }
        } else {
            Entry<K,V> y = leftOf(parentOf(parentOf(x)));
            if (colorOf(y) == RED) {
                setColor(parentOf(x), BLACK);
                setColor(y, BLACK);
                setColor(parentOf(parentOf(x)), RED);
                x = parentOf(parentOf(x));
            } else {
                if (x == leftOf(parentOf(x))) {
                    x = parentOf(x);
                    rotateRight(x);
                }
                setColor(parentOf(x), BLACK);
                setColor(parentOf(parentOf(x)), RED);
                rotateLeft(parentOf(parentOf(x)));
            }
        }
    }
    root.color = BLACK;
}

根据红黑树的规则,对颜色进行check,并修改为对应的颜色。

5.5 fixAfterDeletion

fixAfterDeletion是在删除元素之后再进行平衡的方法:

 /** From CLR */
private void fixAfterDeletion(Entry<K,V> x) {
    while (x != root && colorOf(x) == BLACK) {
        if (x == leftOf(parentOf(x))) {
            Entry<K,V> sib = rightOf(parentOf(x));

            if (colorOf(sib) == RED) {
                setColor(sib, BLACK);
                setColor(parentOf(x), RED);
                rotateLeft(parentOf(x));
                sib = rightOf(parentOf(x));
            }

            if (colorOf(leftOf(sib))  == BLACK &&
                colorOf(rightOf(sib)) == BLACK) {
                setColor(sib, RED);
                x = parentOf(x);
            } else {
                if (colorOf(rightOf(sib)) == BLACK) {
                    setColor(leftOf(sib), BLACK);
                    setColor(sib, RED);
                    rotateRight(sib);
                    sib = rightOf(parentOf(x));
                }
                setColor(sib, colorOf(parentOf(x)));
                setColor(parentOf(x), BLACK);
                setColor(rightOf(sib), BLACK);
                rotateLeft(parentOf(x));
                x = root;
            }
        } else { // symmetric
            Entry<K,V> sib = leftOf(parentOf(x));

            if (colorOf(sib) == RED) {
                setColor(sib, BLACK);
                setColor(parentOf(x), RED);
                rotateRight(parentOf(x));
                sib = leftOf(parentOf(x));
            }

            if (colorOf(rightOf(sib)) == BLACK &&
                colorOf(leftOf(sib)) == BLACK) {
                setColor(sib, RED);
                x = parentOf(x);
            } else {
                if (colorOf(leftOf(sib)) == BLACK) {
                    setColor(rightOf(sib), BLACK);
                    setColor(sib, RED);
                    rotateLeft(sib);
                    sib = leftOf(parentOf(x));
                }
                setColor(sib, colorOf(parentOf(x)));
                setColor(parentOf(x), BLACK);
                setColor(leftOf(sib), BLACK);
                rotateRight(parentOf(x));
                x = root;
            }
        }
    }

    setColor(x, BLACK);
}

通过上述代码根据红黑树的规则进行检查。

6.总结

本文对TreeMap的源码进行了分析,实际上,再分析了前的HashMap和ConcurrentHashMap的源码之后,TreeMap的源码要相对简单得多。其核心就是红黑树,然后左右旋转。关于红黑树的具体操作,本文并没有进行描述。
红黑树是一种比平衡二叉树在插入和删除上效率更好,检索的时候效率与平衡二叉树基本一致的数据结构,相比平衡二叉树,在插入和删除从操作上可以节约时间。这也是为什么HashMap底层会引入红黑树的原因之一。红黑树会大量应用于操作系统底层的各种数据结构。
**需要注意的是,TreeMap不支持key为null的情况,但是支持value为null。这介于HashMap和concurrentHashMap之间。

相关文章

网友评论

    本文标题:聊聊java中的哪些Map:(九)TreeMap源码分析

    本文链接:https://www.haomeiwen.com/subject/tpgwsktx.html