HashMap底层存储原理

作者: 邓立_全栈UncleLi | 来源:发表于2021-05-21 09:22 被阅读0次

hashMap的数据结构
HashMap底层存储原理
HashMap相关
2020-08-10 Map接口
是时候来了解JDK8 HashMap的实现原理了
2020-04-03 Java HashMap的实现原理的文章
Java-HashMap 精讲原理篇
HashMap面试问题整理
(转)HashMap底层实现原理/HashMap与HashTab
JDK1.8关于HashMap的变化

概念

HasnMap是基于map接口实现，元素以键值对的方式存储，并且键和值都可以使用null，因为key不允许重复，因此只能有一个键为null
HaasnMap是无序不重复的，而且HashMap是线程不安全的

不同JVM版本HashMap的展现形式

JDK7
- HashMap的数据结构为：数组 + 链表
JDK8
- HashMap的数据结构为：数组 + 链表 + 红黑树

存储的优点

数组的特点：查询效率高，插入和删除效率低
链表的特点：查询效率低，插入和删除效率高
在HasnMap底层使用数组加（链表或红黑树）的结构完美的解决了数组和链表的问题，使的查询和插入，删除的效率都很高
HashMap的散列表是懒加载机制，在第一次put的时候才会创建

HashMap存储元素的过程

首先将k、v封装到Node对象当中（节点）
调用k的hasnCode()方法取出hash值；通过hashcode值和数组长度取模得到元素存储的下标
此时分为两种情况
- 下标位置上没有元素，直接把元素方进入
- 该所以已有元素，判断该位置的元素和当前元素是否相等，使用equals来比较（默认是比较两个对象的地址）。如果两只相等则直接覆盖，如果不等则（Hash碰撞）在原元素下面使用链表的结构存储该元素（如果已存在链表，则插在链表尾部），每个元素节点都有一个next属性指向下一个节点，这就由数组结构变成了数组+链表；因为链表中元素太多的时候回影响查找效率，所以当链表的元素个数达到8的时候使用链表存储就转变成了使用红黑树存储（当红黑树上的节点数量小于6个，会重新把红黑树变成单向链表数据结构），原因就是红黑树是平衡二叉树，在查找性能方面比聊表要高

HashMap取值的实现

先调用k的hashCode()方法得出哈希值，并通过hash算法转换成数组的下标
通过hash值转换成数组下标后，通过数组定位到下标位置，如果改位置上什么都没有，范围null；如果该位置上有单向链表，那么就拿参数K和单向链表上的每一个节点的K进行equals比较，如果所有equals都返回false，则返回null，如果有一个节点的K和参数K通过equals返回true，那么此时该节点的value就是要获取的value值

扩容

HashMap中有两个重要参数，初始容量大小和负载因子，在HashMap刚开始初始化的时候，使用默认的构造方法，会返回一个空的table，并且 thershold（扩容阈值）为0，因此第一次扩容的时候默认值就会是16，负载因子默认为0.75，用数组容量乘以负载因子得到一个值，一旦数组中存储的元素个数超过这个值就会调用rehash方法将数组容量增加到原来的两倍，threshold也会变为原来的两倍
在做扩容的时候会生成一个新的数组，原来的所有数据需要重新计算哈希码值重新分配到新的数组，所以扩容的操作非常消耗性能。所以，如果知道要存入的数据量比较大的话，可以在创建的时候先指定一个比较大的数据容量
也可以引申到一个问题HashMap是先插入还是先扩容：HashMap初始化后首次插入数据时，先发生resize扩容再插入数据，之后每当插入的数据个数达到threshold时就会发生resize，此时是先插入数据再resize

HashMap中的扩容是在元素插入之前进行的扩容还是元素插入之后进行的扩容

在JDK1.7中是在元素插入前进行的扩容，在JDK1.8中是先加入元素后再判断是否进行扩容

存储元素超过阈值一定会进行扩容吗

在JDK1.7中不一定，只有存储元素超过阈值并且当前存储位置不为null，才会进行扩容，在JDK1.8中会进行扩容

HashMap和HashTable区别

线程方面
- HashMap是非线程安全的，HashTable是线程安全的。 Hashtable的实现方法里面都添加了synchronized关键字来确保线程同步，因此相对而言HashMap性能会高一些，我们平时使用时若无特殊需求建议使用HashMap，在多线程环境下若使用HashMap需要使用Collections.synchronizedMap()方法来获取一个线程安全的集合
HashMap的key可以为null，HashTable的key不可为null
HashMap是对Map接口的实现，HashTable实现了Map接口和Dictionary抽象类
HashMap的初始容量为16，Hashtable初始容量为11，两者的填充因子默认都是0.75，HashMap扩容时是当前容量翻倍即：capacity * 2，Hashtable扩容时是容量翻倍+1即：capacity * 2+1

HashMap中的hashcode怎么生成

调用对象key的hashCode方法，再对这个hashcode方法进行一些右移以及异或运算（使的hashCode的高位和低位都参与到运算中）；通过右移和异或运算可以使hashMap的散列化更强，提高hashMap的get方法的效率

为什么使用HashCode

HashCode的存在主要是为了查找的快捷性, HashCode是用来在散列存储结构中确定对象的存储地址的 ( 用hashcode来代表对象在hash表中的位置 ) , hashCode存在的重要的原因之一就是在HashMap（HashSet其实就是HashMap）中使用（其实Object类的hashCode方法注释已经说明了），HashMap之所以速度快，因为他使用的是散列表，根据key的hashcode值生成数组下标（通过内存地址直接查找，不需要判断，但是需要多出很多内存，相当于以空间换时间）

equals方法和hashcode的关系

归纳总结：

若重写了equals(Object obj)方法，则有必要重写hashCode()方法
若两个对象equals(Object obj)返回true，则hashCode()有必要也返回相同的int数
若两个对象equals(Object obj)返回false，则hashCode()不一定返回不同的int数
若两个对象hashCode()返回相同int数，则equals(Object obj)不一定返回true
若两个对象hashCode()返回不同int数，则equals(Object obj)一定返回false
同一对象在执行期间若已经存储在集合中，则不能修改影响hashCode值的相关信息，否则会导致内存泄露问题

key为null怎么办

key为null的时候，只会放在hashMap的0位置（即key的hashCode为0，对数组长度取余后的下标也是0），不会有链表
在HashMap源码中对put方法对null做了处理，key为null的判断后进入putForNullKey(V value)这个方法，李里面for循环是在talbe[0]链表中查找key为null的元素，如果找到，则将value重新赋值给这个元素的value，并返回原来的value。如果没找到则将这个元素添加到talbe[0]链表的表头

/**
 * HashMap的put方法
 */
public V put(K key, V value) {
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    
    // key为null调用putForNullKey(value)
    if (key == null) return putForNullKey(value);
    
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

/**
 * Offloaded version of put for null keys
 */
private V putForNullKey(V value) {
    // for循环处理key为空的情况
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
}

hashMap的数据结构
1.hashMap的数据结构 2.hashSet的底层结构是hashMap hashSet存储数据的原理：(存储元...
HashMap底层存储原理
概念 HasnMap是基于map接口实现，元素以键值对的方式存储，并且键和值都可以使用null，因为key不允许重...
HashMap相关
HashMap的底层实现原理，get的过程发生了什么 HashMap是用来存储key-value键值对的集合，每一...
2020-08-10 Map接口
一、Map类的实现结构 1.HashMap HashMap底层原理： HashMap底层原理 JDK8的更新： H...
是时候来了解JDK8 HashMap的实现原理了
一 HashMap底层存储结构 HashMap底层结构采用（数组）+（链表 or 红黑树）的形式来存储节点。...
2020-04-03 Java HashMap的实现原理的文章
HashMap的扩容机制---resize() HashMap底层实现原理扩容机制 Java中HashMap的实现原理
Java-HashMap 精讲原理篇
本文涉及HashMap的： HashMap的简单使用 HashMap的存储结构原理 HashMap的扩容方法原理 ...
HashMap面试问题整理
1.HashMap底层原理数据结构底层使用哈希表(数组+链表进行存储),在jdk1.8后当链表长度大于等于8时...
(转)HashMap底层实现原理/HashMap与HashTab
HashMap底层实现原理/HashMap与HashTable区别/HashMap与HashSet区别 ①Hash...
JDK1.8关于HashMap的变化
底层实现原理 ++1.7++HashMap底层是使用数组+链表实现 ++1.8++HashMap底层是使用数组+链...