Java集合之HashMap底层实现原理[1]
前面分析了下jdk 1.7的hashMap底层结构,今天在来说下jdk 1.8的HashMap底层实现,和1.7对比,有哪些不同的地方;
目录如下:
1、底层结构
2、扩容机制
3、线程安全问题
底层结构
同1.7的不同,1.8的底层结构是数组+链表+红黑树;
当链表的长度小于8时且数组的长度不大于64,结构和1.7是一样,相反,会将链表转换为红黑树;
引入红黑树好处:提高了查询的效率,时间复杂度为O(logn);
在1.7 链表插入:头插法,而1.8 改为尾插法,这样可以避免扩容导致的死循环问题;
- 先来看下put方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 初始实例化时,数组为空,赋值初始参数(threshold,cap等)
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 根据(数组长度-1)& key(hash) 获取该数组下标数据为空,则添加节点
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
// 比较key和hash,相同把旧值赋值给变量e
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 如果该链表节点是树节点,则向树节点插入数据
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 遍历链表,如果链表长度>=8,则将普通节点转为红黑树
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 具体红黑树的转换代码
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 省略、、、
}
++modCount;
// 如果数组长度等于阀值,则扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
- treeifyBin 转换树节点
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
// 如果数组为空或者长度小于64,则进行扩容
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
// 如果数组长度大于64,且根据index获取节点不为空,则进行红黑树转换
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K,V> hd = null, tl = null;
do {
// 先将Node节点转为 TreeNode
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;// 树的第一个节点赋值为头节点
else {
//给当前节点指向前一个节点和后一个节点
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
// 转换后的树节点,进行节点的平衡
hd.treeify(tab);
}
}
- treeify平衡树节点(红黑树)
final void treeify(Node<K,V>[] tab) {
TreeNode<K,V> root = null; // 定义根节点
for (TreeNode<K,V> x = this, next; x != null; x = next) {
next = (TreeNode<K,V>)x.next;
x.left = x.right = null;
// 根节点定义为黑色,赋值为root
if (root == null) {
x.parent = null;
x.red = false;
root = x;
}
else {
/*
*如果根节点不为空,通过比较hash值
* 1、根节点 ph > 节点x h,dir = -1,放入左节点
* 2、根节点 ph < 节点x h,dir = 1,放入右节点
* 3、根节点 ph = 节点x,hash冲突,此时调用comparableClassFor(),
* 判断key是否实现Comparable,如果kc != null,继续调用compareComparables()比较;
* 如果dir = 0;则调用 tieBreakOrder()比较
*/
K k = x.key;
int h = x.hash;
Class<?> kc = null;
for (TreeNode<K,V> p = root;;) {
int dir, ph;
K pk = p.key;
if ((ph = p.hash) > h)
dir = -1;
else if (ph < h)
dir = 1;
else if ((kc == null &&
(kc = comparableClassFor(k)) == null) ||
(dir = compareComparables(kc, k, pk)) == 0)
dir = tieBreakOrder(k, pk);
// dir <=0 ,放入根节点的左节点,相反,放入根节点的右节点;
TreeNode<K,V> xp = p;
if ((p = (dir <= 0) ? p.left : p.right) == null) {
x.parent = xp;
if (dir <= 0)
xp.left = x;
else
xp.right = x;
// 平衡红黑树,里面代码省略,另写博客分析
root = balanceInsertion(root, x);
break;
}
}
}
}
// 判断当前root是否为该树的根节点
moveRootToFront(tab, root);
}
扩容机制
其扩容调用的resize(),该方法包含初始化或扩容的实现;
看代码具体实现方式
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
// 如果原数组不为空,且数组容量大于允许的最大值时,不进行扩容,阀值等于2^31-1,直接返回原数组
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
/**
* 走到这步,原数组容量小于最大值,当对原数组扩容为2倍后且原数组容量大于等于默认初始容量时
* 则新的阀值=原阀值 << 1 (原容量>=16,意味着构造函数时指定初始容量或者已经进行了一次扩容操作)
**/
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
// 原数组容量为空,原阀值大于0,说明构造函数时指定的初始容量;
// 将新容量 = 原阀值
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else {
// zero initial threshold signifies using defaults
// 调用无惨构造函数构造map,初始添加元素
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 明构造函数时指定的初始容量,新阀值 = 新容量 * 加载因子(新容量和新阀值在允许范围内,若不满足条件返回Integer.MAX_VALUE)
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; //定义新的数组并指定新的容量大小
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e; // 计算新数组中的下标,将原节点放入新数组
else if (e instanceof TreeNode) // 如果原节点是树节点,则执行切割,这个单独写博客说明
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
/**
* 这里面 lo和hi,暂且根据名称解释:loHead/loTail[低头尾节点] hiHead/hiTail[高头尾节点]
* 数组的扩容大小为原来的2倍,当节点的hash与原容量取模运算结果为0时,因为容量大小为2的N次方,参与运算的有效二进制位的高位肯定为1,
* 比如16的二进制为10000,取模结果为0,则hash的有效二进制位的高位肯定为0,只有*..0**** 和 10000 进行与运算结果才为00000(*..表示不确定的多个二进制位)
* 数组定位下标的运算:hash & (len[数组长度] - 1),例如:下标 = (*..0**** & 1111) 等同于 (*..0**** & 11111) 。1111是15的二进制、11111是31的二进制,也就是2倍扩容
* 所以当该hash值与新的容量取模运算后,与原容量是相同的,也就是说该元素的下标位置不变
**/
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e; // 链表为空时,头节点指向该元素
else
loTail.next = e; // 如果有尾,那么链表不为空,把该元素挂到链表的最后
loTail = e; // 把尾节点设置为当前元素
}
else {
// 如果与运算结果不为0,说明hash值大于老数组长度(例如hash值为17)
// 此时该元素应该放置到新数组的高位位置上
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead; // 低位的元素组成的链表还是放置在原来的位置
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead; // 高位的元素组成的链表位置是在原有位置上偏移了老数组的长度
}
}
}
}
}
return newTab;
}
线程安全
HashMap没有针对多线程环境下做线程安全处理,所以避免在非线程安全的情况下使用hashMap,可以用ConcurrentHashMap来实现;如果在非线程安全的情况下使用了hashMap,可能导致数据不一致的问题
总结
1、同jdk7相比,jdk8增加了红黑树的概念,当链表的长度大于8的时候,会将链表转为红黑树;整个数据结构是单向链表和红黑树是共存的;
2、引入红黑树,对于查找,增加和删除节点的效率都提高很多;
3、计算hash方面,jdk8通过高低位都参与的位运算,增加了随机性,这样性能会更好,效率更高;
网友评论