HashMap

作者: ythmilk | 来源:发表于2021-01-26 14:27 被阅读0次

    HashMap

    HashMap存储的时key-value格式的实例。
    底层的存储结构是数组+链表格式。
    单个实例的格式

        static class Node<K,V> implements Map.Entry<K,V> {
            final int hash;
            final K key;
            V value;
            Node<K,V> next;
    

    一些成员变量

    transient Node<K,V>[] table:底层存储结构
    Set<Map.Entry<K,V>> entrySet:
    size:记录了当前数量
    threshold:临界值threshold = capacity * loadFactor,当size大于临界值就要扩容
    loadFactor:负载因子,衡量HashMap满的程度,默认0.75f

    还有一个capacity容量,不是成员变量,但很重要。

    新建HashMap

     public HashMap(int initialCapacity, float loadFactor) 
    
        public HashMap(int initialCapacity) {
            this(initialCapacity, DEFAULT_LOAD_FACTOR);
        }
    

    无参构造函数,在第一次put数据的时候会进行扩容。

    newCap = DEFAULT_INITIAL_CAPACITY;//16
    newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

        public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
    

    上述构造函数新建时,并没有新建数组,对于前2个,只是设置了负载因子和临界值。
    对于无参的构造函数,在第一次put数据时才会设置负载因子和临界值。
    初始化数组都是在第一次put数据时。

    存取原理

    put方法

    总体的流程就是,如果定位的table[index]为null,直接插入,如果index的key和要插入的相等(地址或者equals)那直接覆盖。如果不是就链表或红黑树遍历,遍历完再走上面流程。


    put流程

    https://www.cnblogs.com/LiaHon/p/11149644.html

    1. 通过hash函数计算存储位置
     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    
    1. 判断table是否为null或长度为0,如果是,调用resize()方法进行扩容
    2. 如果tabel[i]为null,直接构造Node插入
    3. 如果tabel[i]不为null 判断key是否等于index处对应的key,如果相等或者equals方法相等,直接覆盖。
    4. 否则如果是红黑树,插入
    5. 链表的话判断长度是否大于等于8,是的话变为红黑树插入,否则链表 插入。

    get方法

    1. table为null,返回null
    2. 计算hash值,定位到index,判断key是否相等或者equals是否相等,如果相等返回
    3. 否则遍历,如果是TreeNode红黑树,如果是链表,链表遍历。

    为什么需要负载因子:

    因为map映射需要进行hash,如果负载因子是1的话,hash冲突概率变大。0.75是个经验值。
    如果小了,空间利用率低,如果大了,链表长度过长或者红黑树高度过高。

    默认长度为啥是16

    经验值,保证是2的次幂就行(1 << 4; // aka 16

    为什么capatity大小都是2的幂?(真正的大小)

    为了使用二进制完成取模运行,不用做进制转换,效率高。
    hash函数
    初始的阈值计算。

    this.threshold = tableSizeFor(initialCapacity);
    

    该方法是找到第一个比capacity大的2的次幂。
    hash函数的原理还是取模
    X % 2^n = X & (2^n – 1)
    table中index的选择方式:i = (n - 1) & hash
    因此:只要保证length的长度是2^n 的话,就可以实现取模运算了

    https://www.cnblogs.com/hollischuang/p/12009172.html

    扩容方式

    扩容时机

    第一次插入时扩容

            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
    

    容量不够时扩容

            if (++size > threshold)
                resize();
    

    容量不足时扩容的长度2倍

                else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                         oldCap >= DEFAULT_INITIAL_CAPACITY)
                    newThr = oldThr << 1; // double threshold
    

    扩容是插入步骤:

    1. 新建一个2倍数组Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    2. 重新计算index插入newTab[e.hash & (newCap - 1)] = e;

    头插入尾插为啥形成环

    头插入的话,扩容后,链表上实例的相对位置会发生变化。多线程环境下操作可能形成环。

    线程安全相关

    1.在jdk1.7中,在多线程环境下,扩容时会造成环形链或数据丢失。
    2.在jdk1.8中,在多线程环境下,会发生数据覆盖的情况。

    相关文章

      网友评论

          本文标题:HashMap

          本文链接:https://www.haomeiwen.com/subject/slszoktx.html