美文网首页
为什么重写equals要重写hashcode

为什么重写equals要重写hashcode

作者: 凉风拂面秋挽月 | 来源:发表于2020-01-24 00:04 被阅读0次

    equals():判断两个对象的内存地址是否相等
    hashcode(): 返回当前对象的内存地址

    可以用一个形象的比喻,hashCode是equals(原图)的缩略图,查hashCode的比较快,所以很多集合类HashMap等使用对象的hashCode先去判断对象是否相等,再通过equals判断,这样效率比较高。
    所以如果我们不重写hashCode(),在这些集合的操作中就会出问题。

    所以,重写后equals与hashCode的定义必须一致:如果x.equals(y)返回true,那么x.hashCode()就必须与y.hashCode()具有相同的值。
    如果用定义的Employee.equals比较雇员的ID,那么hashCode方法就需要散列ID,而不是雇员的名字或存储地址。

    未重写hashcode()equals()导致hashmap的get异常

    hashmap的get方法

    int hash = (key == null) ? 0 : hash(key);
    for (Entry<K,V> e = table[indexFor(hash, table.length)];e != null;e = e.next) {
        Object k;
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))
            return e;
    }
    static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }
    

    hashmap的get方法流程简单说下,首先调用静态方法hash得到key位于数组的哪一位(hash方法用也时通过hashcode运算得到的)。由于可能会有hash冲突的存在(即出现链表,链表中所有key的hash值相同)。这时候就需要用equals来做key的匹配了。

    实例

    我们定义一个key类,其中的第3行定义了唯一的一个属性id。当前我们先注释掉第9行的equals方法和第16行的hashCode方法。

     import java.util.HashMap;
     class Key {
         private Integer id;
          public Integer getId()
       {return id; }
           public Key(Integer id)
      {this.id = id;  }
       //故意先注释掉equals和hashCode方法
       //  public boolean equals(Object o) {
      //      if (o == null || !(o instanceof Key))
      //      { return false; }
      //      else
      //      { return this.getId().equals(((Key) o).getId());}
      //  }
       
      //  public int hashCode()
      //  { return id.hashCode(); }
      }
    
      public class WithoutHashCode {
          public static void main(String[] args) {
              Key k1 = new Key(1);
             Key k2 = new Key(1);
              HashMap<Key,String> hm = new HashMap<Key,String>();
              hm.put(k1, "Key with id is 1");    
              System.out.println(hm.get(k2));    
         }
      }
    

    在main函数里的第22和23行,我们定义了两个Key对象,它们的id都是1,就好比它们是两把相同的都能打开同一扇门的钥匙。
    在第24行里,我们通过泛型创建了一个HashMap对象。它的键部分可以存放Key类型的对象,值部分可以存储String类型的对象。
    在第25行里,我们通过put方法把k1和一串字符放入到hm里; 而在第26行,我们想用k2去从HashMap里得到值;这就好比我们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果不是我们想象中的那个字符串,而是null。
    原因有两个—没有重写。第一是没有重写hashCode方法,第二是没有重写equals方法。
    当我们往HashMap里放k1时,首先会调用Key这个类的hashCode方法计算它的hash值,随后把k1放入hash值所指引的内存位置。
    关键是我们没有在Key里定义hashCode方法。这里调用的仍是Object类的hashCode方法(所有的类都是Object的子类),而Object类的hashCode方法返回的hash值其实是k1对象的内存地址(假设是1000)。

    image.png
    如果我们随后是调用hm.get(k1),那么我们会再次调用hashCode方法(还是返回k1的地址1000),随后根据得到的hash值,能很快地找到k1。
    但我们这里的代码是hm.get(k2),当我们调用Object类的hashCode方法(因为Key里没定义)计算k2的hash值时,其实得到的是k2的内存地址(假设是2000)。由于k1和k2是两个不同的对象,所以它们的内存地址一定不会相同,也就是说它们的hash值一定不同,这就是我们无法用k2的hash值去拿k1的原因。
    当我们把第16和17行的hashCode方法的注释去掉后,会发现它是返回id属性的hashCode值,这里k1和k2的id都是1,所以它们的hash值是相等的。
    我们再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是100,把k1对象放入到对应的位置。而取k2时,是先计算它的hash值(由于k2的id也是1,这个值也是100),随后到这个位置去找。
    但结果会出乎我们意料:明明100号位置已经有k1,但第26行的输出结果依然是null。其原因就是没有重写Key对象的equals方法。
    HashMap是用链地址法来处理冲突,也就是说,在100号位置上,有可能存在着多个用链表形式存储的对象。它们通过hashCode方法返回的hash值都是100。
    image.png

    当我们通过k2的hashCode到100号位置查找时,确实会得到k1。但k1有可能仅仅是和k2具有相同的hash值,但未必和k2相等(k1和k2两把钥匙未必能开同一扇门),这个时候,就需要调用Key对象的equals方法来判断两者是否相等了。
    由于我们在Key对象里没有定义equals方法,系统就不得不调用Object类的equals方法。由于Object的固有方法是根据两个对象的内存地址来判断,所以k1和k2一定不会相等,这就是为什么依然在26行通过hm.get(k2)依然得到null的原因。

    相关文章

      网友评论

          本文标题:为什么重写equals要重写hashcode

          本文链接:https://www.haomeiwen.com/subject/seyzzctx.html