美文网首页
Java中Map的原理

Java中Map的原理

作者: cauhn | 来源:发表于2017-01-02 13:09 被阅读0次

在Java中常常需要使用Map作为存储工具。下面一一介绍各种Map的原理。

HashMap##

Java中最常用的key-value的保存方式,首先map在初始化的时候会分配一个长为capicity的数组table,保存每个hash值的头指针。后续元素插入map时,每个元素都会放在table数组中对应的hash位置,即table[hash & (capicity - 1)],然后将原位置的其他元素链接在其尾部。

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        int hash;
  }

这里有一个技巧,在创建table数组时,capicity的长度是2的幂次方,这样在计算obj应该放在哪个位置时,可以直接用位与的方法得到,即obj.hash & (capicity-1)
下面我们看看put(key, value)是如何实现的:

 public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        // 计算key的hash值
        int hash = hash(key);
        // 计算hash值所对应的位置 indexFor = hash & (table.length -1)
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            // 想要覆盖值,则必须key的hashCode的值是一样的,且 key.equals(early) 或者 key == early
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                // 在后续的Map中有作用
                e.recordAccess(this);
                return oldValue;
            }
        }
        // 用于记录map的版本,用于在iterator过程中判断map是否有变化
        modCount++;
        // 将key,value构造出来,插入到table中
        addEntry(hash, key, value, i);
        return null;
    }

map在addEntry中会进行threshold的判断,若超过,则会进行resize操作

  void addEntry(int hash, K key, V value, int bucketIndex) {
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }

        createEntry(hash, key, value, bucketIndex);
    }

 void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
       
        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable, rehash);
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }

 void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                // 首先将next指针指向 newTable[i]
                e.next = newTable[i];
                // 将e赋值给newTable[i]
                newTable[i] = e;
                e = next;
            }
        }
    }

Map的remove操作如下:

    public V remove(Object key) {
        Entry<K,V> e = removeEntryForKey(key);
        return (e == null ? null : e.value);
    }

   final Entry<K,V> removeEntryForKey(Object key) {
        int hash = (key == null) ? 0 : hash(key);
        int i = indexFor(hash, table.length);
        Entry<K,V> prev = table[i];
        Entry<K,V> e = prev;

        while (e != null) {
            Entry<K,V> next = e.next;
            Object k;
            // 找到对应的key值
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k)))) {
                modCount++;
                size--;
                if (prev == e)
                    table[i] = next;
                else
                    prev.next = next;
                // 在后续的Map中有作用
                e.recordRemoval(this);
                return e;
            }
            prev = e;
            e = next;
        }

        return e;
    }

以上基本可以概括HashMap的所有,跟大部分的Hash算法实现一样,使用数组加链表的方式保存元素。
HashMap在iterator过程中是从table[]数组中从头遍历到尾的。

PS. 当key的Type是自定义类型时,必须重写hashCode()equal()方法,否则将无法得到想要的结果。

LinkedHashMap

LinkedHashMap中的Linked的意思是指其会保存一个某种关系的链表,这种关系可以为 accessOrder或者insertOrder。LinkedHashMap中使用双向链表保存了这种关系。

  public class LinkedHashMap<K,V>
    extends HashMap<K,V>
    implements Map<K,V>
{
    /**
     * The head of the doubly linked list.
     */
    private transient Entry<K,V> header;

    /**
     * The iteration ordering method for this linked hash map: <tt>true</tt>
     * for access-order, <tt>false</tt> for insertion-order.
     *
     * @serial
     */
    private final boolean accessOrder;

那么LinkedHashMap是如何保存这种关系的呢?首先在constructor中初始化header,同时在createEntry中将本元素放在header后面。这样insert-order可以直接遍历双向链表。
怎么实现access-order的呢,还记得HashMap中的recordAccess和recordRemove吗?LinkedHashMap重写了这两个方法:

       /**
         * This method is invoked by the superclass whenever the value
         * of a pre-existing entry is read by Map.get or modified by Map.set.
         * If the enclosing Map is access-ordered, it moves the entry
         * to the end of the list; otherwise, it does nothing.
         */
        void recordAccess(HashMap<K,V> m) {
            LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m;
            if (lm.accessOrder) {
                lm.modCount++;
                remove();
                addBefore(lm.header);
            }
        }

        void recordRemoval(HashMap<K,V> m) {
            remove();
        }

       /**
         * Removes this entry from the linked list.
         */
        private void remove() {
            before.after = after;
            after.before = before;
        }

因此,在get()和put()方法时,都会将key所对应的entry放在header后面,即提高优先级。
这是实现简单的LRU(最近最少使用的缓存)的方法。

TreeMap

Java中使用红黑树实现TreeMap,使得所有get(),put(), remove(),successor(), pre()操作的时间复杂度都是O(log(n)),与c++中的HashMap实现相同。具体的代码就不一一过了,大家可以看下红黑树的算法。

总结

如果说HashMap是简单版本的hash,那么LinkedHashMap则是保存了插入顺序的Map,TreeMap则是红黑树版Map。

相关文章

网友评论

      本文标题:Java中Map的原理

      本文链接:https://www.haomeiwen.com/subject/eprivttx.html