自己在简书上看了不少的别人总结,那么在借鉴前人(miaoLoveCode)基础上自己再总结一番。
HashMap1.8实现分析
数据结构
1.8的HashMap数据结构是由数组+(链表或红黑树)实现。
构造方法
![](https://img.haomeiwen.com/i2442634/2a6516f9ea4d59d5.png)
几个基本量:
- capacity:容量,bucket数组长度,默认长度为16;
- loadFactor:装载因子,默认值为0.75,它决定了bucket填充程度;
- threshold:决定了HashMap能够放进去的数据量。
对于threshold的初始化会调用tableSizeFor方法计算出一个比initialCapacity大的第一个2的n次幂的值存入threshold。
![](https://img.haomeiwen.com/i2442634/4df91a4181b4e901.png)
bucket的初始化一般都是在第一次调用put方法时完成的。
Hash
JDK 8 中在进行get和put操作时,会先根据key的hashCode进行再散列,再进行bucket对应节点位置计算,请看以下示例:
![](https://img.haomeiwen.com/i2442634/aa6c77fc9d3a1a73.png)
可以看出:h >>> 16,高16位补0,由于任意数跟0异或不变,所以hash的作用就是高16位不变,低16位和高16位做异或运算,来达到减少碰撞的目的。
hash方法的实现:
![](https://img.haomeiwen.com/i2442634/d98a0efa1e351caa.png)
为了提高碰撞下的性能,当链表节点等于8时,JDK8用红黑树代替链表,将原有链表部分查询的时间复杂度o(n)提升为o(logn),继续看JDK 8中的put方法的具体实现。
- put方法
![](https://img.haomeiwen.com/i2442634/420ff82106d7ce5c.png)
- putVal
![](https://img.haomeiwen.com/i2442634/7ec50e310679e5d4.png)
具体流程如下:
1.如果当前bucket为空时,调用resize()方法初始化;
2.根据key的hash值计算出所在的bucket节点的位置;
3.如果没有冲突,也就是
p = tab[i = (n - 1) & hash]=null
调用newNode方法封装key-value键值对,并将其挂到 bucket对应位置下,否则,跳转到步骤4;
4.如果发生冲突
- 遍历链表,如果该key已经存在,则更新原有的oldValue为新的value,并返回oldValue。直到链表末尾没有相同的key的hash值和key(equals,==),则在末尾插入新节点;
- 如果key所在的节点为treeNode,调用rbtree(红黑树)的putTreeVal方法将改节点挂到rbtree上;
- 如果插入节点后,当前bucket节点下链表长度超过8,需要将原有的数据结构链表变为rbtree;
5.数据put完成之后,如果当前数组长度 > threshold,调用resize方法扩容。
resize()
![](https://img.haomeiwen.com/i2442634/8ff443ad58447af8.png)
resize的前半部分主要完成了新的capacity和threshold的计算。从代码实现可以看出,每一次扩容,newCapacity和newThreshold均是扩容前值的两倍,如此设计师为什么?先看个例子来说明这样子设计的原因:
![](https://img.haomeiwen.com/i2442634/a29f797b69eb5b26.png)
从小例子可以看出,resize后,key所在bucket的节点位置保持不变。首先,table.length也就是capacity肯定是2的n次方,根据所在bucket节点下标计算公式:index = hash & (table.length - 1),其实在进行&运算的时候,只是多了一个最高位1,那么新位置要么保持原位置不变,要么在原位置 + oldCapacity,这个设计的巧妙就在于节省了一部分重新计算hash的时间,而且hash值高位出现0和1的概率均等,在resize的过程又将节点平均分配到两个bucket节点。
resize的后半部分对数据做了transfer,具体实现如下:
![](https://img.haomeiwen.com/i2442634/045c163a8d793559.png)
总结
HashMap在JDk1.8比JDK1.7的优化主要在:
1.引入rbtree,在bucket节点下链表长度 = 8时将链表变成rbtree;
2.优化hash和resize,减少resize带来的hash性能消耗。
网友评论