美文网首页
九 HashMap

九 HashMap

作者: BeYearn | 来源:发表于2018-11-21 20:25 被阅读0次
  1. HashMap的性能表现非常依赖于哈希码的有效性.
    hashcode 和 equals 的一些基本约定:
  • equals相等, hashcode一定要相等
  • hashcode 和equals 必须相伴重写,(如果只单纯比较的话equals就行,但有时对象需要放入hash类数据结构中就需要了)
  • hashcode需要保持一致性, 状态
  1. https://www.cnblogs.com/xiaoxi/p/6170590.html
    
    LinkedHashMap 通常提供的是遍历顺序符合插入顺序,它的实现是通过为条目(键值对)维护一个双向链表。注意,通过特定构造函数,我们可以创建反映访问顺序的实例,所谓的 put、get、compute 等,都算作“访问”。
    这种行为适用于一些特定应用场景,例如,我们构建一个空间占用敏感的资源池,希望可以自动将最不常被访问的对象释放掉,这就可以利用 LinkedHashMap 提供的机制来实现,参考下面的示例:
public static void main(String[] args) {
        LinkedHashMap accessOrderedMap = new LinkedHashMap<String, String>(16, 0.75F, true) {
            @Override
            protected boolean removeEldestEntry(Map.Entry<String, String> eldest) { //干掉最老的,也就是最前面的.
                // 实现自定义删除策略,否则行为就和普遍 Map 没有区别
                return this.size() > 3;
            }
        };
        accessOrderedMap.put("Project1", "1");
        accessOrderedMap.put("Project2", "2");
        accessOrderedMap.put("Project3", "3");
        accessOrderedMap.forEach((k, v) -> {
            System.out.println(k + ":" + v);
        });
        // 模拟访问
        accessOrderedMap.get("Project1");
        //accessOrderedMap.get("Project2");
        //accessOrderedMap.get("Project3");
        System.out.println("==============");

        //accessOrder为true的话,则会把访问过的元素放在链表后面,即放置的顺序是访问的顺序(最后访问,就在最后)
        accessOrderedMap.forEach((k, v) -> {
            System.out.println(k + ":" + v);
        });
        // 触发删除
        accessOrderedMap.put("Project4", "Mission Control");
        System.out.println("Oldest entry should be removed:");
        accessOrderedMap.forEach((k, v) -> {// 遍历顺序不变
            System.out.println(k + ":" + v);
        });
    }
  1. HashMap的实现
    基于哈希表的Map 接口的实现。底层采取hash表(散列表),即数组+链表+红黑树的存储方法,并允许使用null 值和null 键。(除了非同步和允许使用 null 之外,HashMap 类与Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。
图片.png

上图中每个小格是一个node节点对象

        final int hash;
        final K key;
        V value;
        Node<K,V> next;
        Node(int hash, K key, V value, Node<K,V> next) {
            //每个对象具有的hash值
           this.hash = hash;
            //键
           this.key = key;
            //值
           this.value = value;
            //指向下一个结点
           this.next = next;
        }

在进行put操作时,首先会根据键key得到hashcode, 然后得到其hash值, 然后再转换为数组中的下标, 如果数组该位置为null, 则直接存储, 如果该位置已有对象数据, 即碰撞, 则把碰撞的数据用链表存储于之后. 如果链表数据过长(默认大于8) 则会转化为红黑树
红黑树是jdk1.8中新增加的,为了解决链表过长造成的性能问题。另外也避免通过构造哈希冲突的数据大量与服务器交互, 造成cpu大量占用, 形成哈希碰撞拒绝服务攻击

几个概念(jdk1.8)

  • DEFAULT_INITIAL_CAPACITY = 1 << 4(默认初始数组的容量为16)
  • DEFAULT_LOAD_FACTOR = 0.75f(默认的负载因子为0.75)
  • size(存储的键值对个数)
  • threshold(threshold就是在此Load factor和length(数组长度)对应下允许的最大元素数目,threshold = length * Load factor)
  • modCount(modCount字段主要用来记录HashMap内部结构发生变化的次数,主要用于迭代的快速失败。强调一点, 内部结构发生变化指的是结构发生变化,例如put新键值对,但是某个key对应的value值被覆盖不属于结构变化)
    比如数组长度为16, 负载因子为0.75. threshold = 16*0.75=12个. 当size>threshold 时, 就要进行扩容处理, 会2的幂次方增加, 这里就是16扩到到32

put方法

   public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
   final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //如果table数组为空或者长度为0,则进行扩容
       if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //根据hash算法算出存储的下标,如果为空,即不发生碰撞,则直接存储
       if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            //如果发生碰撞,且键值对已经存在,则进行值得覆盖
           if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //存储为红黑树
           else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                 //链表
                 for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        //如果链上的结点大于REEEIFY_THRESHOLD(默认为8),则转化为红黑树
                       if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
               if (e.hash == hash &&
             ((k = e.key) == key || (key != null && key.equals(k))))
                break;
                p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

****get方法***

  public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }
  final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

关于hash值计算的几点:

  • 无论是键还是值, 都应该是一个对象(基本数据类型会自动装箱). hashcode默认得到的就是根据对象地址转换来的
  • hash()方法 是把hashcode(是个int)和它右移16位后的值进行异或(^)运算得到
    static final int hash(Object key) { int h; //计算hashCode,并无符号移动到低位 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
  • 把计算得到的hash值与数组长度-1进行与运算得到下标(tab[(n - 1) & hash]即可得的数组值). 因为数组的长度始终为2的次方幂.
    这里的与运算, 就相当于给length-1取模运算


    图片.png

故 :
集合初始化时, 指定集合初始值大小。
说明: HashMap使用HashMap(int initialCapacity)初始化,
负载因子 * 初始容量 > 元素数量
正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子(即loader factor)默认为0.75, 如果暂时无法确定初始值大小,请设置为16(即默认值)。
反例:HashMap需要放置1024个元素,由于没有设置容量初始大小,随着元素不断增加,容量7次被迫扩大,resize需要重建hash表,严重影响性能。

Java_HashMap的工作原理(Jdk1.8)

相关文章

  • 九 HashMap

    HashMap的性能表现非常依赖于哈希码的有效性.hashcode 和 equals 的一些基本约定: equal...

  • HashMap了解一下

    前言 HashMap HashMap类继承图 HashMap属性 HashMap构造函数HashMap(int i...

  • HashMap源码

    eg: HashMap hashMap = new HashMap<>(); hashMap.put(1,"QG...

  • 2018-03-12

    HashMap in Java HashMap in Redis HashMap in Golang

  • HashMap源码理解

    HashMap理解 HashMap定义 HashMap实现机制 HashMap与HashTable的主要区别 关键...

  • 【16】 hashmap

    hashmap 1.7 和1.8的区别 hashmap全家桶 hashmap 源码解析 hashmap hashm...

  • HashMap源码分析

    HashMap数据结构 HashMap数据结构.png HashMap继承图 HashMap-class.jpg ...

  • HashMap剖析

    Java集合:HashMap源码剖析 一、HashMap概述 二、HashMap的数据结构 三、HashMap源码...

  • Java-HashMap 精讲原理篇

    本文涉及HashMap的: HashMap的简单使用 HashMap的存储结构原理 HashMap的扩容方法原理 ...

  • HashMap源码解析 (HashMap类-构造方法)

    1. HashMap() 2. HashMap(int initialCapacity) 3. HashMap(...

网友评论

      本文标题:九 HashMap

      本文链接:https://www.haomeiwen.com/subject/xspcqqtx.html