美文网首页
HashMap源码-概述

HashMap源码-概述

作者: kkyeer | 来源:发表于2018-11-25 12:35 被阅读0次

Implementation Notes

  • HashMap有两个参数,initialCapacity(默认16),loadFactor默认0.75,当容器内节点数量多于initialCapacity*loadFactor,自动扩充
  • loadFactor越大,时间(puth和get的时间)成本越高,越小,空间成本越高
  • 一般情况下,内部存储的是哈希表,当内容过大时,转变为TreeNode容器,TreeNode容器内部类似TreeMap的结构,HashMap的方法大部分不区分,只在TreeNode有额外实现时被调用(通过instrance of TreeNode)方法,使用TreeNode容器是为了在数据过多时能够快速查找,然而因为大部分Map内部元素没有达到需要Tree Bin(树状容器)存储的要求(默认64个元素),所以checking for existence of tree bins may be delayed in the course of table methods.
  • 树形态根据key的哈希码排序,但是当类实现了Comparable接口时,类的compareTo方法被调用来排序,在多个实例返回同样的hashCode的情况下,通过实现compareTo方法来提高效率
  • TreeNode大小大概是普通Node的两倍,因此需要一个阈值来控制它的启用

常量

  • DEFAULT_INITIAL_CAPACITY 初始化容量,16
  • MAXIMUM_CAPACITY 最大容量,2的30次方
  • DEFAULT_LOAD_FACTOR 负载比例,0.75
  • TREEIFY_THRESHOLD 树状阈值,HashMap相同hash的默认放到同一个节点并next链时穿起来,但当链长>=TREEIFY_THRESHOLD时,需将链变为树状以提升访问效率
  • UNTREEIFY_THRESHOLD (树状转数组的阈值,6)
  • MIN_TREEIFY_CAPACITY 最小转树状阈值,64

内部静态Node类

  • 内部存储final hash,final key,value,next四个变量
  • hashCode方法返回Objects.hashCode(key) ^ Objects.hashCode(value)
public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }
  • equals方法要求key和value对equals方法都成立

方法

1.hash方法

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

计算key的hash,结尾是key的hashCode方法返回值(int型)的高16位拼接高16位与低16位按位异或的结果
这么做的原因是:table中计算key对应存储位置的时候,使用的是(capacity-1)&hash,当n=16时,相当于16&hash,也就是,000000000000000001111&hash,也就是前28位确认为0,hash的后四位决定是否碰撞,对于只在高位有区别的key,是大概率会碰撞的,因此将高16位spread到低位去,可以在某些场景减少碰撞,下面是验证:

public static void main(String[] args) {
        Float f1 = 11111.0f;
        Float f2 = 111111.0f;
        int capacity = 16;
        System.out.println("f1的二进制:"+Integer.toBinaryString(f1.hashCode()));
        System.out.println("f2的二进制:"+Integer.toBinaryString(f2.hashCode()));
        System.out.println("HashMap630行,位置计算方式为(n - 1) & hash,假设当前容量为16\n若不进行spread,则:");
        int index1 = (capacity-1)&f1.hashCode();
        int index2 = (capacity-1)&f2.hashCode();
        System.out.println("位置1为:"+index1);
        System.out.println("位置2为:"+index2);
        System.out.println("发生碰撞\n若进行spread:");
        index1 = (capacity-1)&spreadHash(f1.hashCode());
        index2 = (capacity-1)&spreadHash(f2.hashCode());
        System.out.println("位置1为:"+index1);
        System.out.println("位置2为:"+index2);
        System.out.println("不发生碰撞");
    }

    /**
     * 按hashMap的方法,计算spread后的hash
     * @param hash
     * @return
     */
    static  int spreadHash(int hash){
        return hash ^ (hash >>> 16);
    }

f1的二进制:1000110001011011001110000000000
f2的二进制:1000111110110010000001110000000
根据HashMap源码630行,位置计算方式为(n - 1) & hash,假设当前容量为16
若不进行spread,则:
位置1为:0
位置2为:0
发生碰撞
若进行spread:
位置1为:13
位置2为:9
不发生碰撞

为什么是^不是|或者&,验证可得按&是不好的,比如上面例子,按位与的话,还是会碰撞(结果都是0),^和|的运算结果一致,待探究

2.comparableClassFor方法:判断是否实现Comparable接口

static Class<?> comparableClassFor(Object x)

  • 因为String类型的key最多,且实现了Comparable接口,所以入参为String类的直接返回String.class,
  • 判断类实现Comparable接口,且泛型实际类型为自己,则返回
  • 否则返回null

3.compareComparables方法:返回两个Comparable对象的比较值

static int compareComparables(Class<?> kc, Object k, Object x)

  • kc:实现了Comparable接口的实体类
  • k:对象1 c:对象2
  • 通过调用时保证类型正确
  • x为空或者不是kc类型时返回空,否则返回k.compareTo(x)

4.tableSizeFor:HashMap的方法,计算目标容量对应的2的次方数容量

static final int tableSizeFor(int cap)

内部变量

1.transient Node<K,V>[] table;

核心存储变量,随需要resize,初始化时,容量大小是2的次方

2.transient Set<Map.Entry<K,V>> entrySet;

保存缓存的entrySet

3.transient int size;

存储当前map的大小

4.transient int modCount;

存储当前map发生Structural modifications的次数,用于在迭代时快速失败(fail-fast)

5.int threshold;

下一次resize的阈值,比如当前threshold为16,当前要放17个元素进去,则需要resize

6.final float loadFactor;

负载因子

相关文章

网友评论

      本文标题:HashMap源码-概述

      本文链接:https://www.haomeiwen.com/subject/gmrpqqtx.html