美文网首页Java 杂谈
HashMap用法及源码解读

HashMap用法及源码解读

作者: 紫轩丶 | 来源:发表于2018-07-11 23:56 被阅读0次

    1.HashMap简介

    1.HashMap继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口
    2.HashMap的实现不是同步的,所以不是线程安全的
    3.HashMap实例有两个参数 :
    初始容量:哈希表在创建时的容量
    加载因子:哈希表在其容量自动增加之前可以达到多满的一种尺度
    当哈希表中的条目数量超出了加载因子和当前容量的乘积时,则对哈希表进行rehash操作,从而翻倍桶数
    哈希桶的概念:一个哈希表由多个桶(Bucket)组成,Bucket以HashKey值为索引,同一个桶中存放不同的元素,寻找某个元素时会先索引到相应的桶上,再找到该元素,查找更快

    HashMap共有4个构造函数:

    // 默认构造函数。
    HashMap()
    
    // 指定“容量大小”的构造函数
    HashMap(int initialCapacity)
    
    // 指定“容量大小”和“加载因子”的构造函数
    HashMap(int initialCapacity, float loadFactor)
    
    // 包含“子Map”的构造函数
    HashMap(Map<? extends K, ? extends V> map)
    

    2.继承关系

    public class HashMap<K,V> extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable
    

    3.源码解读(基于jdk1.8)

    HashMap就是一个散列表,它是通过“拉链法”解决哈希冲突的

    transient Node<K,V>[] table;
    

    HashMap中的key-value都是存储于Node数组中的
    Node的数据结构:

    static class Node<K,V> implements Map.Entry<K,V> {
            final int hash;
            final K key;
            V value;
            Node<K,V> next;
    
            Node(int hash, K key, V value, Node<K,V> next) {
                this.hash = hash;
                this.key = key;
                this.value = value;
                this.next = next;
            }
    
            public final K getKey()        { return key; }
            public final V getValue()      { return value; }
            public final String toString() { return key + "=" + value; }
    
            public final int hashCode() {
                return Objects.hashCode(key) ^ Objects.hashCode(value);
            }
    
            public final V setValue(V newValue) {
                V oldValue = value;
                value = newValue;
                return oldValue;
            }
    
            public final boolean equals(Object o) {
                if (o == this)
                    return true;
                if (o instanceof Map.Entry) {
                    Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                    if (Objects.equals(key, e.getKey()) &&
                        Objects.equals(value, e.getValue()))
                        return true;
                }
                return false;
            }
        }
    

    是一个单向链表,因此可以知道HashMap是通过“拉链法”解决冲突的

    构造函数:

       //同时指定“初始容量”和“加载因子”
        public HashMap(int initialCapacity, float loadFactor) {
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal initial capacity: " +
                                                   initialCapacity);
            if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
    
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: "      +loadFactor);
            this.loadFactor = loadFactor;
            this.threshold = tableSizeFor(initialCapacity);
    
          }
    
    //指定“初始容量”
    
    public HashMap(int initialCapacity) {
            this(initialCapacity, DEFAULT_LOAD_FACTOR);
        }
    
    //默认构造函数
    
    public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
    
    //包含“子map”的构造函数
    
    public HashMap(Map<? extends K, ? extends V> m) {
            this.loadFactor = DEFAULT_LOAD_FACTOR;
            putMapEntries(m, false);
        }
    

    4.主要接口

    4.1 clear()

    清空HashMap。将所有元素设为null

    public void clear() {
            Node<K,V>[] tab;
            modCount++;
            if ((tab = table) != null && size > 0) {
                size = 0;
                for (int i = 0; i < tab.length; ++i)
                    tab[i] = null;
            }
        }
    

    即遍历所有节点将其设为null

    4.2 containsKey()

    判断HashMap中是否包含key

    public boolean containsKey(Object key) {
            return getNode(hash(key), key) != null;
        }
    

    其中

    final Node<K,V> getNode(int hash, Object key) {
            Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (first = tab[(n - 1) & hash]) != null) {
                if (first.hash == hash && // always check first node
                    ((k = first.key) == key || (key != null && key.equals(k))))
                    return first;
                if ((e = first.next) != null) {
                    if (first instanceof TreeNode)
                        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                    do {
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            return e;
                    } while ((e = e.next) != null);
                }
            }
            return null;
        }
    

    即通过getNode(hash(key), key)来获得相应的Node,然后判断该Node是否存在。具体实现源码中已给出

    4.3 containsValue()

    判断HashMap中是否包含值为value的元素

    public boolean containsValue(Object value) {
            Node<K,V>[] tab; V v;
            if ((tab = table) != null && size > 0) {
                for (int i = 0; i < tab.length; ++i) {
                    for (Node<K,V> e = tab[i]; e != null; e = e.next) {
                        if ((v = e.value) == value ||
                            (value != null && value.equals(v)))
                            return true;
                    }
                }
            }
            return false;
        }
    

    即遍历查询是否有值为value的节点

    4.4 get()

    通过key获取value

    public V get(Object key) {
            Node<K,V> e;
            return (e = getNode(hash(key), key)) == null ? null : e.value;
        }
    

    其中

    final Node<K,V> getNode(int hash, Object key) {
            Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (first = tab[(n - 1) & hash]) != null) {
                if (first.hash == hash && // always check first node
                    ((k = first.key) == key || (key != null && key.equals(k))))
                    return first;
                if ((e = first.next) != null) {
                    if (first instanceof TreeNode)
                        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                    do {
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            return e;
                    } while ((e = e.next) != null);
                }
            }
            return null;
        }
    

    4.5 put()

    将“key-value”键值对添加到HashMap中

    public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }
    
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
            else {
                Node<K,V> e; K k;
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                else if (p instanceof TreeNode)
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                    for (int binCount = 0; ; ++binCount) {
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                treeifyBin(tab, hash);
                            break;
                        }
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        p = e;
                    }
                }
                if (e != null) { // existing mapping for key
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)
                        e.value = value;
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
            ++modCount;
            if (++size > threshold)
                resize();
            afterNodeInsertion(evict);
            return null;
        }
    
    

    从源码中我们可以注意到以下几点:

    1.如果原来map中已经存在了key值,那么会用新值替换旧值
    2.如果新增了元素之后,实际容量超过了阈值threshold,那么会重新调整hashmap的实际容量,即翻倍(resize()具体源码在这里不再说明)

    4.6 remove()

    删除map中某个元素

    public V remove(Object key) {
            Node<K,V> e;
            return (e = removeNode(hash(key), key, null, false, true)) == null ?
                null : e.value;
        }
    
    final Node<K,V> removeNode(int hash, Object key, Object value,
                                   boolean matchValue, boolean movable) {
            Node<K,V>[] tab; Node<K,V> p; int n, index;
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (p = tab[index = (n - 1) & hash]) != null) {
                Node<K,V> node = null, e; K k; V v;
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    node = p;
                else if ((e = p.next) != null) {
                    if (p instanceof TreeNode)
                        node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                    else {
                        do {
                            if (e.hash == hash &&
                                ((k = e.key) == key ||
                                 (key != null && key.equals(k)))) {
                                node = e;
                                break;
                            }
                            p = e;
                        } while ((e = e.next) != null);
                    }
                }
                if (node != null && (!matchValue || (v = node.value) == value ||
                                     (value != null && value.equals(v)))) {
                    if (node instanceof TreeNode)
                        ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                    else if (node == p)
                        tab[index] = node.next;
                    else
                        p.next = node.next;
                    ++modCount;
                    --size;
                    afterNodeRemoval(node);
                    return node;
                }
            }
            return null;
        }
    

    从源码可以看出本质上就是删除单链表中的一个节点

    4.7 replace()

    替换map中的某个元素,如果该key值不存在,则返回null;否则返回被替换的元素

    public V replace(K key, V value) {
            Node<K,V> e;
            if ((e = getNode(hash(key), key)) != null) {
                V oldValue = e.value;
                e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
            return null;
        }
    

    4.7 clone()

    克隆一个 HashMap,之前我们提到HashMap实现了Cloneable接口,即实现了clone方法

    public Object clone() {
            HashMap<K,V> result;
            try {
                result = (HashMap<K,V>)super.clone();
            } catch (CloneNotSupportedException e) {
                // this shouldn't happen, since we are Cloneable
                throw new InternalError(e);
            }
            result.reinitialize();
            result.putMapEntries(this, false);
            return result;
        }
    

    5.如何遍历一个HashMap

    本节是重点,在大致了解了HashMap的实现原理后,我们就要去看一下如何遍历一个HashMap

    主要有4种遍历方式:

    //遍历键
            Set<Integer> set = map.keySet();
            for (Integer key : set) {
                System.out.println(key + ":" + map.get(key));
            }
            //遍历值(但不能遍历键)
            Collection<String> values = map.values();
            for (String value : values) {
                System.out.println(value);
            }
            //遍历键值对
            Set<Entry<Integer,String>> entrySet = map.entrySet();
            for (Entry<Integer, String> entry : entrySet) {
                System.out.println(entry.getKey() + ":" + entry.getValue());
            }
            //遍历键值对(通过迭代器)
            Iterator<Entry<Integer, String>> iterator = entrySet.iterator();
            while(iterator.hasNext())
            {
                Entry<Integer, String> entry = iterator.next();
                System.out.println(entry.getKey() + ":" + entry.getValue());
            }
    

    其中第三种方式最为简单,但是第四种方式效率最高(读者可通过上述所讲的原理自行思考)

    6.关于HashMap的几个问题

    ① hashMap和ConcurrentHashMap的区别

    ConcurrentHashMap是jdk1.5之后引入的,为了解决hashmap线程不安全的问题
    ConcurrentHashMap代码中可以看出,它引入了一个“分段锁”的概念,具体可以理解为把一个大的Map拆分成N个小的HashTable,根据key.hashCode()来决定把key放到哪个HashTable中。
    在ConcurrentHashMap中,就是把Map分成了N个Segment,put和get的时候,都是现根据key.hashCode()算出放到哪个Segment中


    两种结构示意图.png

    ②hashmap为什么线程不安全

    从上述讲解可知,hashmap内部变量存储使用的结构是单链表,这时候我们可以知道,如果多个线程同时执行put操作,并且他们的hashkey相同,那么它们就会发生碰撞,这时势必会丢失一个数据

    而且,当多个线程同时检测到总数量超过门限值的时候就会同时调用resize操作,各自生成新的数组并rehash后赋给该map底层的数组table,结果最终只有最后一个线程生成的新数组被赋给table变量,其他线程的均会丢失。而且当某些线程已经完成赋值而其他线程刚开始的时候,就会用已经被赋值的table作为原始数组,这样也会有问题

    ③如果key是自定义的类,怎么办?

    重写hashcode()和equals()

    HashMap是基于散列函数,以数组和链表的方式实现的。

    而对于每一个对象,通过其hashCode()方法可为其生成一个整形值(散列码),该整型值被处理后,将会作为数组下标,存放该对象所对应的Entry(存放该对象及其对应值)。

    equals()方法则是在HashMap中插入值或查询时会使用到。当HashMap中插入 值或查询值对应的散列码与数组中的散列码相等时,则会通过equals方法比较key值是否相等,所以想以自建对象作为HashMap的key,必须重写 该对象继承object的equals方法。

    HashMap中的比较key是这样的,先求出key的hashcode(),比较其值是否相等,若相等再比较equals(),若相等则认为他们是相等 的。若equals()不相等则认为他们不相等。如果只重写hashcode()不重写equals()方法,当比较equals()时只是看他们是否为 同一对象(即进行内存地址的比较),所以必定要两个方法一起重写。HashMap用来判断key是否相等的方法,其实是调用了HashSet判断加入元素 是否相等

    如果不重写hashcode(),那么两个含义相同的对象比较是其地址,不相等

    转载请注明出处,谢谢!

    相关文章

      网友评论

        本文标题:HashMap用法及源码解读

        本文链接:https://www.haomeiwen.com/subject/yjokpftx.html