天天看點

面試官:重寫 equals 時為什麼一定要重寫 hashCode?

重要說明:本篇為部落客《面試題精選-基礎篇》系列中的一篇,關注我,檢視更多面試題。Gitee 面試題系列開源位址:https://gitee.com/mydb/interview

本題目難度:低

常見程度:高

equals 方法和 hashCode 方法是 Object 類中的兩個基礎方法,它們共同協作來判斷兩個對象是否相等。為什麼要這樣設計嘞?原因就出在“性能” 2 字上。

使用過 HashMap 我們就知道,通過 hash 計算之後,我們就可以直接定位出某個值存儲的位置了,那麼試想一下,如果你現在要查詢某個值是否在集合中?如果不通過 hash 方式直接定位元素(的存儲位置),那麼就隻能按照集合的前後順序,一個一個的詢問比對了,而這種依次比對的效率明顯低于 hash 定位的方式。這就是 hash 以及 hashCode 存在的價值。

當我們對比兩個對象是否相等時,我們就可以先使用 hashCode 進行比較,如果比較的結果是 true,那麼就可以使用 equals 再次确認兩個對象是否相等,如果比較的結果是 true,那麼這兩個對象就是相等的,否則其他情況就認為兩個對象不相等。這樣就大大的提升了對象比較的效率,這也是為什麼 Java 設計使用 hashCode 和 equals 協同的方式,來确認兩個對象是否相等的原因。

那為什麼不直接使用 hashCode 就确定兩個對象是否相等呢?

這是因為不同對象的 hashCode 可能相同;但 hashCode 不同的對象一定不相等,是以使用 hashCode 可以起到快速初次判斷對象是否相等的作用。

但即使知道了以上基礎知識,依然解決不了本篇的問題,也就是:重寫 equals 時為什麼一定要重寫 hashCode?要想了解這個問題的根本原因,我們還得先從這兩個方法開始說起。

Object 類中的 equals 方法用于檢測一個對象是否等于另外一個對象。在 Object 類中,這個方法将判斷兩個對象是否具有相同的引用。如果兩個對象具有相同的引用,它們一定是相等的。

equals 方法的實作源碼如下:

通過上述源碼和 equals 的定義我們可以看出,在大多數情況來說,equals 的判斷是沒有什麼意義的!例如,使用 Object 中的 equals 比較兩個自定義的對象是否相等,這就完全沒有意義(因為無論對象是否相等,結果都是 false)。

通過以下示例,就可以說明這個問題:

以上程式的執行結果,如下圖所示:

是以通常情況下,我們要判斷兩個對象是否相等,一定要重寫 equals 方法,這就是為什麼要重寫 equals 方法的原因。

hashCode 翻譯為中文是散列碼,它是由對象推導出的一個整型值,并且這個值為任意整數,包括正數或負數。

需要注意的是:散列碼是沒有規律的。如果 x 和 y 是兩個不同的對象,x.hashCode() 與 y.hashCode() 基本上不會相同;但如果 a 和 b 相等,則 a.hashCode() 一定等于 b.hashCode()。

hashCode 在 Object 中的源碼如下:

從上述源碼可以看到,Object 中的 hashCode 調用了一個(native)本地方法,傳回了一個 int 類型的整數,當然,這個整數可能是正數也可能是負數。

相等的值 hashCode 一定相同的示例:

不同的值 hashCode 也有可能相同的示例:

接下來回到本文的主題,重寫 equals 為什麼一定要重寫 hashCode?

為了解釋這個問題,我們需要從下面的這個例子入手。

Set 集合是用來儲存不同對象的,相同的對象就會被 Set 合并,最終留下一份獨一無二的資料。

它的正常用法如下:

從上述結果可以看出,重複的資料已經被 Set 集合“合并”了,這也是 Set 集合最大的特點:去重。

然而,如果我們在 Set 集合中存儲的是,隻重寫了 equals 方法的自定義對象時,有趣的事情就發生了,如下代碼所示:

從上述代碼和上述圖檔可以看出,即使兩個對象是相等的,Set 集合竟然沒有将二者進行去重與合并。這就是重寫了 equals 方法,但沒有重寫 hashCode 方法的問題所在。

為了解決上面的問題,我們嘗試在重寫 equals 方法時,把 hashCode 方法也一起重寫了,實作代碼如下:

通過上述結果可以看出,當我們一起重寫了兩個方法之後,奇迹的事情又發生了,Set 集合又恢複正常了,這是為什麼呢?

出現以上問題的原因是,如果隻重寫了 equals 方法,那麼預設情況下,Set 進行去重操作時,會先判斷兩個對象的 hashCode 是否相同,此時因為沒有重寫 hashCode 方法,是以會直接執行 Object 中的 hashCode 方法,而 Object 中的 hashCode 方法對比的是兩個不同引用位址的對象,是以結果是 false,那麼 equals 方法就不用執行了,直接傳回的結果就是 false:兩個對象不是相等的,于是就在 Set 集合中插入了兩個相同的對象。

但是,如果在重寫 equals 方法時,也重寫了 hashCode 方法,那麼在執行判斷時會去執行重寫的 hashCode 方法,此時對比的是兩個對象的所有屬性的 hashCode 是否相同,于是調用 hashCode 傳回的結果就是 true,再去調用 equals 方法,發現兩個對象确實是相等的,于是就傳回 true 了,是以 Set 集合就不會存儲兩個一模一樣的資料了,于是整個程式的執行就正常了。

hashCode 和 equals 兩個方法是用來協同判斷兩個對象是否相等的,采用這種方式的原因是可以提高程式插入和查詢的速度,如果在重寫 equals 時,不重寫 hashCode,就會導緻在某些場景下,例如将兩個相等的自定義對象存儲在 Set 集合時,就會出現程式執行的異常,為了保證程式的正常執行,是以我們就需要在重寫 equals 時,也一并重寫 hashCode 方法才行。

關注公衆号:Java面試真題解析,檢視更多 Java 面試題。

關注下面二維碼,訂閱更多精彩内容。

面試官:重寫 equals 時為什麼一定要重寫 hashCode?
面試官:重寫 equals 時為什麼一定要重寫 hashCode?
面試官:重寫 equals 時為什麼一定要重寫 hashCode?

關注公衆号(加好友):

面試官:重寫 equals 時為什麼一定要重寫 hashCode?

作者:

王磊的部落格

出處:

http://vipstone.cnblogs.com/