美文网首页
HashMap源代码解析

HashMap源代码解析

作者: agmtpoy | 来源:发表于2018-09-10 23:31 被阅读0次

    请大家多多指教、讨论,谢谢😁
    分析版本为JDK1.8

    类注释

    HashMap实现了Map接口。HashMap实现了所有的Map操作,允许null作为key和null作为value。HashMap类似与HashTable,只是HashMap是线程不安全的并且允许null值。HashMap不能保证映射的顺序,特别是随着键值对的增加而增加。
    这个实现在假设hash函数将元素均匀的分布在桶中的前提下,对元素的基本操作(get()/put())都是时间复杂度稳定的。对集合的迭代速度与实例中桶的容量以及健值对的数量成正比。因此在迭代性能要求较高的情况下,不要将初始容量设置的太高或者负载系数设置的太低(负载系数太低,就会频繁的扩容)。
    HashMap有两个影响性能的参数:初始容量和负载因子;容量是hash表中的桶数量,初始容量是实例创建时候的容量。负载因子是允许容量自动增长时占用桶和桶容量的最大比列,当hash表中的桶数量大于负载因子和当前容量的乘积时,Hash表会进行重排(重新构建内部结构),使ahsh表进行扩容为当前桶的两倍。
    一般情况下,负载因子为0.75,这是一个时空效率下的权衡,较高的负载因子,节省了空间,但是会增加查询时间。在设置初始容量的时候应该考虑Map中预期的数量和负载因子,尽可能的减少重排的次数。如果初始容量大于Map最大数量除以负载因子的值,那么就不会花生重排。
    如果要在HashMap中存储很多实例,那么就应该创建具有足够大的初始容量的Map,而不必让它根据需求进行扩容,重排来增长表。注意:大量的存储对象使用同一个hash值(@code hashCode())会显著降低hashMap的性能。为了降低影响,在存储对象实现了Comparable接口时,通过对象自己的比较来顺序来判断关系。
    注意此实现不同步。如果有多个线程同事访问HashMap,至少有一个线程在进行HashMap结构上的修改时,必须在调用方进行同步操作(修改结构是指对HashMap进行添加一个或多个元素的操作,只对已存储的对象进行操作时,不属于对结构的修改),这通常是使用一些线程安全的Map对象来进行操作。如果没有这样的类,可以将Collections.synchronizedMap类包装后使用。
    HashMap返回的iterators是fail-fast机制的,Fail-fast iterators会抛出ConcurrentModificationException异常。因此,编写依赖与ConcurrentModificationException的程序是错误的,fail-fast 机制只是用与检测错误。

    主要方法

    序号 方法名称 作用
    1 hash(Object key) 计算key的hash值
    2 put(K key,V value) 装载元素
    3 get(Object key) 根据key返回指定value
    4 resize() 桶扩容
    5 remove(Object key) 移除指定key的元素

    hash(Object key)方法

        static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }
    

    1.对key为null健值对始终返回0
    2.对高16位的key进行处理
    h>>>16,将h无符号右移16位,如果h大于2^16,将h的高16位将参与hashCode的计算(异或)。做这步操作的原因是因为,桶的容量是2的幂数倍(n),在进行put的时候,将(n-1)&hash计算出桶的位置,n-1的二进制全为1,此时如果hash值的低16位未参与计算,在进行&操作时,如果如果为0那么值不发生改变始终是0,这就会导致在tab[0]处聚集大量元素,影响性能。移动16位,int类型占用4个字节,32位bit,因此采用右移16位。

    put(K key,V value)方法

        public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }
    

    调用putVal方法

        final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            //判断数组是否存在,不存在进行扩容操作resize()
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            //如果数组位置上没有元素,直接将该元素放进去
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
            else {
                 //数组上该位置已经存在元素
                Node<K,V> e; K k;
                //如果元素的hash值并且key与插入元素的相等,那么就执行替换
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                //如果当前元素为TreeNode,按照红黑树插入
                else if (p instanceof TreeNode)
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                      //普通的插入
                    for (int binCount = 0; ; ++binCount) {
                        //如果链表元素的下一个节点为null,直接进行插入
                        if ((e = p.next) == null) {
                            //在列表上追加元素
                            p.next = newNode(hash, key, value, null);
                            //如果列表长度大于等于8,进行列表转红黑树操作
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                treeifyBin(tab, hash);
                            break;
                        }
                        //依次判断列表的下一个元素是否与被插入元素相等,如果相等就结束循环,并且e在上一次循环中已经被赋值
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        //让p继续指向下一个节点
                        p = e;
                    }
                }
                //如果e不等于null,说明原列表中存在相同的值,因此新value替换old value,返回old value
                if (e != null) { // existing mapping for key
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)
                        e.value = value;
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
          //操作次数加1
            ++modCount;
            //判断是否大于阈值
            if (++size > threshold)
                resize();
            afterNodeInsertion(evict);
            return null;
        }
    

    resize()方法

    final Node<K,V>[] resize() {
            Node<K,V>[] oldTab = table;
            //如果table为null,是初始化,反之是扩容
            int oldCap = (oldTab == null) ? 0 : oldTab.length;
            int oldThr = threshold;
            int newCap, newThr = 0;
            //扩容
            if (oldCap > 0) {
                //数组长度达到HashMap的最大长度,不能进行扩容,将阈值设置为MAX_VALUE,返回原数据
                if (oldCap >= MAXIMUM_CAPACITY) {
                    threshold = Integer.MAX_VALUE;
                    return oldTab;
                }
                //如果新桶长度小于最大长度并且原桶长度大于等于最小桶长度那么进行扩容(2倍)
                else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                         oldCap >= DEFAULT_INITIAL_CAPACITY)
                    newThr = oldThr << 1; // double threshold
            }
            //如果有阈值,将桶长度设置为阈值长度
            else if (oldThr > 0) // initial capacity was placed in threshold
                newCap = oldThr;
            else {               // zero initial threshold signifies using defaults
                //如果初始化没有设置阈值,数组长度固定为16,阈值为12
                newCap = DEFAULT_INITIAL_CAPACITY;
                newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
            }
            //如果阈值为0,重新设置阈值
            if (newThr == 0) {
              //新数组长度*负载因子
                float ft = (float)newCap * loadFactor;
                newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                          (int)ft : Integer.MAX_VALUE);
            }
            //设置阈值
            threshold = newThr;
           //old数组复制new数组
            ......
            return newTab;
        }
    

    get(Object key)方法

        public V get(Object key) {
            Node<K,V> e;
            return (e = getNode(hash(key), key)) == null ? null : e.value;
        }
    

    调用Node<K,V> getNode(int hash, Object key)方法

    final Node<K,V> getNode(int hash, Object key) {
            Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
             //桶元素存在,并且第一个节点有值
            if ((tab = table) != null && (n = tab.length) > 0 &&
                (first = tab[(n - 1) & hash]) != null) {
                判断是否是第一个节点
                if (first.hash == hash && // always check first node
                    ((k = first.key) == key || (key != null && key.equals(k))))
                    return first;
                //链表的下一个元素是否有值
                if ((e = first.next) != null) {
                    //是否是红黑树
                    if (first instanceof TreeNode)
                        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                    //循环遍历节点
                      do {
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            return e;
                    } while ((e = e.next) != null);
                }
            }
            return null;
        }
    

    remove(Object key)方法

        public V remove(Object key) {
            Node<K,V> e;
            return (e = removeNode(hash(key), key, null, false, true)) == null ?
                null : e.value;
        }
    

    调用removeNode(hash(key), key, null, false, true)方法
    与get()方法类似

    相关文章

      网友评论

          本文标题:HashMap源代码解析

          本文链接:https://www.haomeiwen.com/subject/ngflgftx.html