- HashMap的性能表现非常依赖于哈希码的有效性.
hashcode 和 equals 的一些基本约定:
- equals相等, hashcode一定要相等
- hashcode 和equals 必须相伴重写,(如果只单纯比较的话equals就行,但有时对象需要放入hash类数据结构中就需要了)
- hashcode需要保持一致性, 状态
-
LinkedHashMap 通常提供的是遍历顺序符合插入顺序,它的实现是通过为条目(键值对)维护一个双向链表。注意,通过特定构造函数,我们可以创建反映访问顺序的实例,所谓的 put、get、compute 等,都算作“访问”。https://www.cnblogs.com/xiaoxi/p/6170590.html
这种行为适用于一些特定应用场景,例如,我们构建一个空间占用敏感的资源池,希望可以自动将最不常被访问的对象释放掉,这就可以利用 LinkedHashMap 提供的机制来实现,参考下面的示例:
public static void main(String[] args) {
LinkedHashMap accessOrderedMap = new LinkedHashMap<String, String>(16, 0.75F, true) {
@Override
protected boolean removeEldestEntry(Map.Entry<String, String> eldest) { //干掉最老的,也就是最前面的.
// 实现自定义删除策略,否则行为就和普遍 Map 没有区别
return this.size() > 3;
}
};
accessOrderedMap.put("Project1", "1");
accessOrderedMap.put("Project2", "2");
accessOrderedMap.put("Project3", "3");
accessOrderedMap.forEach((k, v) -> {
System.out.println(k + ":" + v);
});
// 模拟访问
accessOrderedMap.get("Project1");
//accessOrderedMap.get("Project2");
//accessOrderedMap.get("Project3");
System.out.println("==============");
//accessOrder为true的话,则会把访问过的元素放在链表后面,即放置的顺序是访问的顺序(最后访问,就在最后)
accessOrderedMap.forEach((k, v) -> {
System.out.println(k + ":" + v);
});
// 触发删除
accessOrderedMap.put("Project4", "Mission Control");
System.out.println("Oldest entry should be removed:");
accessOrderedMap.forEach((k, v) -> {// 遍历顺序不变
System.out.println(k + ":" + v);
});
}
- HashMap的实现
基于哈希表的Map 接口的实现。底层采取hash表(散列表),即数组+链表+红黑树的存储方法,并允许使用null 值和null 键。(除了非同步和允许使用 null 之外,HashMap 类与Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。

上图中每个小格是一个node节点对象
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
//每个对象具有的hash值
this.hash = hash;
//键
this.key = key;
//值
this.value = value;
//指向下一个结点
this.next = next;
}
在进行put操作时,首先会根据键key得到hashcode, 然后得到其hash值, 然后再转换为数组中的下标, 如果数组该位置为null, 则直接存储, 如果该位置已有对象数据, 即碰撞, 则把碰撞的数据用链表存储于之后. 如果链表数据过长(默认大于8) 则会转化为红黑树
红黑树是jdk1.8中新增加的,为了解决链表过长造成的性能问题。另外也避免通过构造哈希冲突的数据大量与服务器交互, 造成cpu大量占用, 形成哈希碰撞拒绝服务攻击
几个概念(jdk1.8)
- DEFAULT_INITIAL_CAPACITY = 1 << 4(默认初始数组的容量为16)
- DEFAULT_LOAD_FACTOR = 0.75f(默认的负载因子为0.75)
- size(存储的键值对个数)
- threshold(threshold就是在此Load factor和length(数组长度)对应下允许的最大元素数目,threshold = length * Load factor)
- modCount(modCount字段主要用来记录HashMap内部结构发生变化的次数,主要用于迭代的快速失败。强调一点, 内部结构发生变化指的是结构发生变化,例如put新键值对,但是某个key对应的value值被覆盖不属于结构变化)
比如数组长度为16, 负载因子为0.75. threshold = 16*0.75=12个. 当size>threshold 时, 就要进行扩容处理, 会2的幂次方增加, 这里就是16扩到到32
put方法
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果table数组为空或者长度为0,则进行扩容
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//根据hash算法算出存储的下标,如果为空,即不发生碰撞,则直接存储
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
//如果发生碰撞,且键值对已经存在,则进行值得覆盖
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//存储为红黑树
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果链上的结点大于REEEIFY_THRESHOLD(默认为8),则转化为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
****get方法***
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
关于hash值计算的几点:
- 无论是键还是值, 都应该是一个对象(基本数据类型会自动装箱). hashcode默认得到的就是根据对象地址转换来的
- hash()方法 是把hashcode(是个int)和它右移16位后的值进行异或(^)运算得到
static final int hash(Object key) { int h; //计算hashCode,并无符号移动到低位 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
-
把计算得到的hash值与数组长度-1进行与运算得到下标(tab[(n - 1) & hash]即可得的数组值). 因为数组的长度始终为2的次方幂.
这里的与运算, 就相当于给length-1取模运算
图片.png
故 :
集合初始化时, 指定集合初始值大小。
说明: HashMap使用HashMap(int initialCapacity)初始化,
负载因子 * 初始容量 > 元素数量
正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子(即loader factor)默认为0.75, 如果暂时无法确定初始值大小,请设置为16(即默认值)。
反例:HashMap需要放置1024个元素,由于没有设置容量初始大小,随着元素不断增加,容量7次被迫扩大,resize需要重建hash表,严重影响性能。
网友评论