HashMap就是这么简单【源码剖析】

作者: Java3y | 来源:发表于2018-04-10 21:04 被阅读483次

HashMap就是这么简单【源码剖析】
HashMap剖析
Java集合：HashMap源码剖析
java基础之集合略解
HashMap源码剖析
HashMap源码剖析
ArrayList源码解析
HashMap源码，看我这篇就够了
深入剖析 Java7 中的 HashMap 和 Concurre
收藏夹

前言

声明，本文用得是jdk1.8

前面已经讲了Collection的总览和剖析List集合以及散列表、Map集合、红黑树的基础了：

本篇主要讲解HashMap，以及涉及到一些与hashtable的比较~

看这篇文章之前最好是有点数据结构的基础：

当然了，如果讲得有错的地方还请大家多多包涵并不吝在评论去指正～

一、HashMap剖析

首先看看HashMap的顶部注释说了些什么：

image

再来看看HashMap的类继承图：

image

下面我们来看一下HashMap的属性：

image

成员属性有这么几个：

image

再来看一下hashMap的一个内部类Node：

image

我们知道Hash的底层是散列表，而在Java中散列表的实现是通过数组+链表的~

再来简单看看put方法就可以印证我们的说法了：数组+链表-->散列表

image

我们可以简单总结出HashMap：

无序，允许为null，非同步
底层由散列表(哈希表)实现
初始容量和装载因子对HashMap影响挺大的，设置小了不好，设置大了也不好

1.1HashMap构造方法

HashMap的构造方法有4个：

YhO335B.png

image

在上面的构造方法最后一行，我们会发现调用了tableSizeFor()，我们进去看看：

image

这是位运算算法，具体流程可参考：

看完上面可能会感到奇怪的是：为啥是将2的整数幂的数赋给threshold？

threshold这个成员变量是阈值，决定了是否要将散列表再散列。它的值应该是：capacity * load factor才对的。

其实这里仅仅是一个初始化，当创建哈希表的时候，它会重新赋值的：

image

至于别的构造方法都差不多，这里我就不细讲了：

image

1.2put方法

put方法可以说是HashMap的核心，我们来看看：

image

我们来看看它是怎么计算哈希值的：

image

为什么要这样干呢？？我们一般来说直接将key作为哈希值不就好了吗，做异或运算是干嘛用的？？

我们看下来：

image

我们是根据key的哈希值来保存在散列表中的，我们表默认的初始容量是16，要放到散列表中，就是0-15的位置上。也就是tab[i = (n - 1) & hash]。可以发现的是：在做&运算的时候，仅仅是后4位有效~那如果我们key的哈希值高位变化很大，低位变化很小。直接拿过去做&运算，这就会导致计算出来的Hash值相同的很多。

而设计者将key的哈希值的高位也做了运算(与高16位做异或运算，使得在做&运算时，此时的低位实际上是高位与低位的结合)，这就增加了随机性，减少了碰撞冲突的可能性！

下面我们再来看看流程是怎么样的：

image

新值覆盖旧值，返回旧值测试：

image

接下来我们看看resize()方法，在初始化的时候要调用这个方法，当散列表元素大于capacity * load factor的时候也是调用resize()

image

1.3get方法

image

接下来我们看看getNode()是怎么实现的：

image

1.4remove方法

image

再来看看removeNode()的实现：

image

二、HashMap与Hashtable对比

从存储结构和实现来讲基本上都是相同的。它和HashMap的最大的不同是它是线程安全的，另外它不允许key和value为null。Hashtable是个过时的集合类，不建议在新代码中使用，不需要线程安全的场合可以用HashMap替换，需要线程安全的场合可以用ConcurrentHashMap替换

image

Hashtable具体阅读源码可参考：

四、总结

在JDK8中HashMap的底层是：数组+链表(散列表)+红黑树

在散列表中有装载因子这么一个属性，当装载因子*初始容量小于散列表元素时，该散列表会再散列，扩容2倍！

装载因子的默认值是0.75，无论是初始大了还是初始小了对我们HashMap的性能都不好

装载因子初始值大了，可以减少散列表再散列(扩容的次数)，但同时会导致散列冲突的可能性变大(散列冲突也是耗性能的一个操作，要得操作链表(红黑树)！
装载因子初始值小了，可以减小散列冲突的可能性，但同时扩容的次数可能就会变多！

初始容量的默认值是16，它也一样，无论初始大了还是小了，对我们的HashMap都是有影响的：

初始容量过大，那么遍历时我们的速度就会受影响~
初始容量过小，散列表再散列(扩容的次数)可能就变得多，扩容也是一件非常耗费性能的一件事~

从源码上我们可以发现：HashMap并不是直接拿key的哈希值来用的，它会将key的哈希值的高16位进行异或操作，使得我们将元素放入哈希表的时候增加了一定的随机性。

还要值得注意的是：并不是桶子上有8位元素的时候它就能变成红黑树，它得同时满足我们的散列表容量大于64才行的~

2SnIQ5e.png

image

明天要是无意外的话，可能会写TreeMap，敬请期待哦~~~~

image

文章的目录导航：https://zhongfucheng.bitcron.com/post/shou-ji/gong-zhong-hao-wen-zhang-zheng-li

如果文章有错的地方欢迎指正，大家互相交流。习惯在微信看技术文章，想要获取更多的Java资源的同学，可以关注微信公众号:Java3y。为了大家方便，刚新建了一下qq群：742919422，大家也可以去交流交流。
谢谢支持了！希望能多介绍给其他有需要的朋友

参考资料：

HashMap就是这么简单【源码剖析】
前言声明，本文用得是jdk1.8 前面已经讲了Collection的总览和剖析List集合以及散列表、Map集合...
HashMap剖析
Java集合：HashMap源码剖析一、HashMap概述二、HashMap的数据结构三、HashMap源码...
Java集合：HashMap源码剖析
非常推荐Java集合：HashMap源码剖析 1.HashMap概述 HashMap基于哈希表的 Map ...
java基础之集合略解
Java集合：整体结构 HashMap剖析 Java 集合系列10之 HashMap详细介绍(源码解析)和使用示例...
HashMap源码剖析
前言这篇博客讲一下JAVA集合类中的HashMap。HashMap底层是通过维护一个数组来保存元素。当创建Has...
HashMap源码剖析
1.JDK1.7中HashMap源码分析底层数据结构是数组，产生哈希冲突时使用链表处理，并且是头插法。数组大小...
ArrayList源码解析
1、本文主要内容 ArrayList源码简介 ArrayList源码剖析总结之前总结过HashMap和Link...
HashMap源码，看我这篇就够了
HashMap源码深度剖析 1 定义 HashMap基于哈希表的Map接口实现，是以key-value存储形式存在...
深入剖析 Java7 中的 HashMap 和 Concurre
本文将深入剖析 Java7 中的 HashMap 和 ConcurrentHashMap 的源码，解析 HashM...
收藏夹
博文 Java 集合：Java 集合学习指南 Java 集合：Java 集合源码剖析 HashMap：HashMa...