HashMap簡介
HashMap是基于哈希表實作的,每一個元素是一個key-value對,其内部通過單連結清單解決沖突問題,容量不足(超過了閥值)時,同樣會自動增長。
HashMap是非線程安全的,隻是用于單線程環境下,多線程環境下可以采用concurrent并發包下的concurrentHashMap。
HashMap 實作了Serializable接口,是以它支援序列化,實作了Cloneable接口,能被克隆。
HashMap源碼剖析
HashMap的源碼如下(加入了比較詳細的注釋):
[java] view plain copy
- package java.util;
- import java.io.*;
- public class HashMap<K,V>
- extends AbstractMap<K,V>
- implements Map<K,V>, Cloneable, Serializable
- {
- // 預設的初始容量(容量為HashMap中槽的數目)是16,且實際容量必須是2的整數次幂。
- static final int DEFAULT_INITIAL_CAPACITY = 16;
- // 最大容量(必須是2的幂且小于2的30次方,傳入容量過大将被這個值替換)
- static final int MAXIMUM_CAPACITY = 1 << 30;
- // 預設加載因子為0.75
- static final float DEFAULT_LOAD_FACTOR = 0.75f;
- // 存儲資料的Entry數組,長度是2的幂。
- // HashMap采用連結清單法解決沖突,每一個Entry本質上是一個單向連結清單
- transient Entry[] table;
- // HashMap的底層數組中已用槽的數量
- transient int size;
- // HashMap的門檻值,用于判斷是否需要調整HashMap的容量(threshold = 容量*加載因子)
- int threshold;
- // 加載因子實際大小
- final float loadFactor;
- // HashMap被改變的次數
- transient volatile int modCount;
- // 指定“容量大小”和“加載因子”的構造函數
- public HashMap(int initialCapacity, float loadFactor) {
- if (initialCapacity < 0)
- throw new IllegalArgumentException("Illegal initial capacity: " +
- initialCapacity);
- // HashMap的最大容量隻能是MAXIMUM_CAPACITY
- if (initialCapacity > MAXIMUM_CAPACITY)
- initialCapacity = MAXIMUM_CAPACITY;
- //加載是以不能小于0
- if (loadFactor <= 0 || Float.isNaN(loadFactor))
- throw new IllegalArgumentException("Illegal load factor: " +
- loadFactor);
- // 找出“大于initialCapacity”的最小的2的幂
- int capacity = 1;
- while (capacity < initialCapacity)
- capacity <<= 1;
- // 設定“加載因子”
- this.loadFactor = loadFactor;
- // 設定“HashMap門檻值”,當HashMap中存儲資料的數量達到threshold時,就需要将HashMap的容量加倍。
- threshold = (int)(capacity * loadFactor);
- // 建立Entry數組,用來儲存資料
- table = new Entry[capacity];
- init();
- }
- // 指定“容量大小”的構造函數
- public HashMap(int initialCapacity) {
- this(initialCapacity, DEFAULT_LOAD_FACTOR);
- }
- // 預設構造函數。
- public HashMap() {
- // 設定“加載因子”為預設加載因子0.75
- this.loadFactor = DEFAULT_LOAD_FACTOR;
- // 設定“HashMap門檻值”,當HashMap中存儲資料的數量達到threshold時,就需要将HashMap的容量加倍。
- threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
- // 建立Entry數組,用來儲存資料
- table = new Entry[DEFAULT_INITIAL_CAPACITY];
- init();
- }
- // 包含“子Map”的構造函數
- public HashMap(Map<? extends K, ? extends V> m) {
- this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
- DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
- // 将m中的全部元素逐個添加到HashMap中
- putAllForCreate(m);
- }
- //求hash值的方法,重新計算hash值
- static int hash(int h) {
- h ^= (h >>> 20) ^ (h >>> 12);
- return h ^ (h >>> 7) ^ (h >>> 4);
- }
- // 傳回h在數組中的索引值,這裡用&代替取模,旨在提升效率
- // h & (length-1)保證傳回值的小于length
- static int indexFor(int h, int length) {
- return h & (length-1);
- }
- public int size() {
- return size;
- }
- public boolean isEmpty() {
- return size == 0;
- }
- // 擷取key對應的value
- public V get(Object key) {
- if (key == null)
- return getForNullKey();
- // 擷取key的hash值
- int hash = hash(key.hashCode());
- // 在“該hash值對應的連結清單”上查找“鍵值等于key”的元素
- for (Entry<K,V> e = table[indexFor(hash, table.length)];
- e != null;
- e = e.next) {
- Object k;
- //判斷key是否相同
- if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
- return e.value;
- }
- //沒找到則傳回null
- return null;
- }
- // 擷取“key為null”的元素的值
- // HashMap将“key為null”的元素存儲在table[0]位置,但不一定是該連結清單的第一個位置!
- private V getForNullKey() {
- for (Entry<K,V> e = table[0]; e != null; e = e.next) {
- if (e.key == null)
- return e.value;
- }
- return null;
- }
- // HashMap是否包含key
- public boolean containsKey(Object key) {
- return getEntry(key) != null;
- }
- // 傳回“鍵為key”的鍵值對
- final Entry<K,V> getEntry(Object key) {
- // 擷取哈希值
- // HashMap将“key為null”的元素存儲在table[0]位置,“key不為null”的則調用hash()計算哈希值
- int hash = (key == null) ? 0 : hash(key.hashCode());
- // 在“該hash值對應的連結清單”上查找“鍵值等于key”的元素
- for (Entry<K,V> e = table[indexFor(hash, table.length)];
- e != null;
- e = e.next) {
- Object k;
- if (e.hash == hash &&
- ((k = e.key) == key || (key != null && key.equals(k))))
- return e;
- }
- return null;
- }
- // 将“key-value”添加到HashMap中
- public V put(K key, V value) {
- // 若“key為null”,則将該鍵值對添加到table[0]中。
- if (key == null)
- return putForNullKey(value);
- // 若“key不為null”,則計算該key的哈希值,然後将其添加到該哈希值對應的連結清單中。
- int hash = hash(key.hashCode());
- int i = indexFor(hash, table.length);
- for (Entry<K,V> e = table[i]; e != null; e = e.next) {
- Object k;
- // 若“該key”對應的鍵值對已經存在,則用新的value取代舊的value。然後退出!
- if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
- // 若“該key”對應的鍵值對不存在,則将“key-value”添加到table中
- modCount++;
- //将key-value添加到table[i]處
- addEntry(hash, key, value, i);
- return null;
- }
- // putForNullKey()的作用是将“key為null”鍵值對添加到table[0]位置
- private V putForNullKey(V value) {
- for (Entry<K,V> e = table[0]; e != null; e = e.next) {
- if (e.key == null) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
- // 如果沒有存在key為null的鍵值對,則直接題阿見到table[0]處!
- modCount++;
- addEntry(0, null, value, 0);
- return null;
- }
- // 建立HashMap對應的“添加方法”,
- // 它和put()不同。putForCreate()是内部方法,它被構造函數等調用,用來建立HashMap
- // 而put()是對外提供的往HashMap中添加元素的方法。
- private void putForCreate(K key, V value) {
- int hash = (key == null) ? 0 : hash(key.hashCode());
- int i = indexFor(hash, table.length);
- // 若該HashMap表中存在“鍵值等于key”的元素,則替換該元素的value值
- for (Entry<K,V> e = table[i]; e != null; e = e.next) {
- Object k;
- if (e.hash == hash &&
- ((k = e.key) == key || (key != null && key.equals(k)))) {
- e.value = value;
- return;
- }
- }
- // 若該HashMap表中不存在“鍵值等于key”的元素,則将該key-value添加到HashMap中
- createEntry(hash, key, value, i);
- }
- // 将“m”中的全部元素都添加到HashMap中。
- // 該方法被内部的構造HashMap的方法所調用。
- private void putAllForCreate(Map<? extends K, ? extends V> m) {
- // 利用疊代器将元素逐個添加到HashMap中
- for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
- Map.Entry<? extends K, ? extends V> e = i.next();
- putForCreate(e.getKey(), e.getValue());
- }
- }
- // 重新調整HashMap的大小,newCapacity是調整後的容量
- void resize(int newCapacity) {
- Entry[] oldTable = table;
- int oldCapacity = oldTable.length;
- //如果就容量已經達到了最大值,則不能再擴容,直接傳回
- if (oldCapacity == MAXIMUM_CAPACITY) {
- threshold = Integer.MAX_VALUE;
- return;
- }
- // 建立一個HashMap,将“舊HashMap”的全部元素添加到“新HashMap”中,
- // 然後,将“新HashMap”指派給“舊HashMap”。
- Entry[] newTable = new Entry[newCapacity];
- transfer(newTable);
- table = newTable;
- threshold = (int)(newCapacity * loadFactor);
- }
- // 将HashMap中的全部元素都添加到newTable中
- void transfer(Entry[] newTable) {
- Entry[] src = table;
- int newCapacity = newTable.length;
- for (int j = 0; j < src.length; j++) {
- Entry<K,V> e = src[j];
- if (e != null) {
- src[j] = null;
- do {
- Entry<K,V> next = e.next;
- int i = indexFor(e.hash, newCapacity);
- e.next = newTable[i];
- newTable[i] = e;
- e = next;
- } while (e != null);
- }
- }
- }
- // 将"m"的全部元素都添加到HashMap中
- public void putAll(Map<? extends K, ? extends V> m) {
- // 有效性判斷
- int numKeysToBeAdded = m.size();
- if (numKeysToBeAdded == 0)
- return;
- // 計算容量是否足夠,
- // 若“目前閥值容量 < 需要的容量”,則将容量x2。
- if (numKeysToBeAdded > threshold) {
- int targetCapacity = (int)(numKeysToBeAdded / loadFactor + 1);
- if (targetCapacity > MAXIMUM_CAPACITY)
- targetCapacity = MAXIMUM_CAPACITY;
- int newCapacity = table.length;
- while (newCapacity < targetCapacity)
- newCapacity <<= 1;
- if (newCapacity > table.length)
- resize(newCapacity);
- }
- // 通過疊代器,将“m”中的元素逐個添加到HashMap中。
- for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
- Map.Entry<? extends K, ? extends V> e = i.next();
- put(e.getKey(), e.getValue());
- }
- }
- // 删除“鍵為key”元素
- public V remove(Object key) {
- Entry<K,V> e = removeEntryForKey(key);
- return (e == null ? null : e.value);
- }
- // 删除“鍵為key”的元素
- final Entry<K,V> removeEntryForKey(Object key) {
- // 擷取哈希值。若key為null,則哈希值為0;否則調用hash()進行計算
- int hash = (key == null) ? 0 : hash(key.hashCode());
- int i = indexFor(hash, table.length);
- Entry<K,V> prev = table[i];
- Entry<K,V> e = prev;
- // 删除連結清單中“鍵為key”的元素
- // 本質是“删除單向連結清單中的節點”
- while (e != null) {
- Entry<K,V> next = e.next;
- Object k;
- if (e.hash == hash &&
- ((k = e.key) == key || (key != null && key.equals(k)))) {
- modCount++;
- size--;
- if (prev == e)
- table[i] = next;
- else
- prev.next = next;
- e.recordRemoval(this);
- return e;
- }
- prev = e;
- e = next;
- }
- return e;
- }
- // 删除“鍵值對”
- final Entry<K,V> removeMapping(Object o) {
- if (!(o instanceof Map.Entry))
- return null;
- Map.Entry<K,V> entry = (Map.Entry<K,V>) o;
- Object key = entry.getKey();
- int hash = (key == null) ? 0 : hash(key.hashCode());
- int i = indexFor(hash, table.length);
- Entry<K,V> prev = table[i];
- Entry<K,V> e = prev;
- // 删除連結清單中的“鍵值對e”
- // 本質是“删除單向連結清單中的節點”
- while (e != null) {
- Entry<K,V> next = e.next;
- if (e.hash == hash && e.equals(entry)) {
- modCount++;
- size--;
- if (prev == e)
- table[i] = next;
- else
- prev.next = next;
- e.recordRemoval(this);
- return e;
- }
- prev = e;
- e = next;
- }
- return e;
- }
- // 清空HashMap,将所有的元素設為null
- public void clear() {
- modCount++;
- Entry[] tab = table;
- for (int i = 0; i < tab.length; i++)
- tab[i] = null;
- size = 0;
- }
- // 是否包含“值為value”的元素
- public boolean containsValue(Object value) {
- // 若“value為null”,則調用containsNullValue()查找
- if (value == null)
- return containsNullValue();
- // 若“value不為null”,則查找HashMap中是否有值為value的節點。
- Entry[] tab = table;
- for (int i = 0; i < tab.length ; i++)
- for (Entry e = tab[i] ; e != null ; e = e.next)
- if (value.equals(e.value))
- return true;
- return false;
- }
- // 是否包含null值
- private boolean containsNullValue() {
- Entry[] tab = table;
- for (int i = 0; i < tab.length ; i++)
- for (Entry e = tab[i] ; e != null ; e = e.next)
- if (e.value == null)
- return true;
- return false;
- }
- // 克隆一個HashMap,并傳回Object對象
- public Object clone() {
- HashMap<K,V> result = null;
- try {
- result = (HashMap<K,V>)super.clone();
- } catch (CloneNotSupportedException e) {
- // assert false;
- }
- result.table = new Entry[table.length];
- result.entrySet = null;
- result.modCount = 0;
- result.size = 0;
- result.init();
- // 調用putAllForCreate()将全部元素添加到HashMap中
- result.putAllForCreate(this);
- return result;
- }
- // Entry是單向連結清單。
- // 它是 “HashMap鍊式存儲法”對應的連結清單。
- // 它實作了Map.Entry 接口,即實作getKey(), getValue(), setValue(V value), equals(Object o), hashCode()這些函數
- static class Entry<K,V> implements Map.Entry<K,V> {
- final K key;
- V value;
- // 指向下一個節點
- Entry<K,V> next;
- final int hash;
- // 構造函數。
- // 輸入參數包括"哈希值(h)", "鍵(k)", "值(v)", "下一節點(n)"
- Entry(int h, K k, V v, Entry<K,V> n) {
- value = v;
- next = n;
- key = k;
- hash = h;
- }
- public final K getKey() {
- return key;
- }
- public final V getValue() {
- return value;
- }
- public final V setValue(V newValue) {
- V oldValue = value;
- value = newValue;
- return oldValue;
- }
- // 判斷兩個Entry是否相等
- // 若兩個Entry的“key”和“value”都相等,則傳回true。
- // 否則,傳回false
- public final boolean equals(Object o) {
- if (!(o instanceof Map.Entry))
- return false;
- Map.Entry e = (Map.Entry)o;
- Object k1 = getKey();
- Object k2 = e.getKey();
- if (k1 == k2 || (k1 != null && k1.equals(k2))) {
- Object v1 = getValue();
- Object v2 = e.getValue();
- if (v1 == v2 || (v1 != null && v1.equals(v2)))
- return true;
- }
- return false;
- }
- // 實作hashCode()
- public final int hashCode() {
- return (key==null ? 0 : key.hashCode()) ^
- (value==null ? 0 : value.hashCode());
- }
- public final String toString() {
- return getKey() + "=" + getValue();
- }
- // 當向HashMap中添加元素時,繪調用recordAccess()。
- // 這裡不做任何處理
- void recordAccess(HashMap<K,V> m) {
- }
- // 當從HashMap中删除元素時,繪調用recordRemoval()。
- // 這裡不做任何處理
- void recordRemoval(HashMap<K,V> m) {
- }
- }
- // 新增Entry。将“key-value”插入指定位置,bucketIndex是位置索引。
- void addEntry(int hash, K key, V value, int bucketIndex) {
- // 儲存“bucketIndex”位置的值到“e”中
- Entry<K,V> e = table[bucketIndex];
- // 設定“bucketIndex”位置的元素為“新Entry”,
- // 設定“e”為“新Entry的下一個節點”
- table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
- // 若HashMap的實際大小 不小于 “門檻值”,則調整HashMap的大小
- if (size++ >= threshold)
- resize(2 * table.length);
- }
- // 建立Entry。将“key-value”插入指定位置。
- void createEntry(int hash, K key, V value, int bucketIndex) {
- // 儲存“bucketIndex”位置的值到“e”中
- Entry<K,V> e = table[bucketIndex];
- // 設定“bucketIndex”位置的元素為“新Entry”,
- // 設定“e”為“新Entry的下一個節點”
- table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
- size++;
- }
- // HashIterator是HashMap疊代器的抽象出來的父類,實作了公共了函數。
- // 它包含“key疊代器(KeyIterator)”、“Value疊代器(ValueIterator)”和“Entry疊代器(EntryIterator)”3個子類。
- private abstract class HashIterator<E> implements Iterator<E> {
- // 下一個元素
- Entry<K,V> next;
- // expectedModCount用于實作fast-fail機制。
- int expectedModCount;
- // 目前索引
- int index;
- // 目前元素
- Entry<K,V> current;
- HashIterator() {
- expectedModCount = modCount;
- if (size > 0) { // advance to first entry
- Entry[] t = table;
- // 将next指向table中第一個不為null的元素。
- // 這裡利用了index的初始值為0,從0開始依次向後周遊,直到找到不為null的元素就退出循環。
- while (index < t.length && (next = t[index++]) == null)
- ;
- }
- }
- public final boolean hasNext() {
- return next != null;
- }
- // 擷取下一個元素
- final Entry<K,V> nextEntry() {
- if (modCount != expectedModCount)
- throw new ConcurrentModificationException();
- Entry<K,V> e = next;
- if (e == null)
- throw new NoSuchElementException();
- // 注意!!!
- // 一個Entry就是一個單向連結清單
- // 若該Entry的下一個節點不為空,就将next指向下一個節點;
- // 否則,将next指向下一個連結清單(也是下一個Entry)的不為null的節點。
- if ((next = e.next) == null) {
- Entry[] t = table;
- while (index < t.length && (next = t[index++]) == null)
- ;
- }
- current = e;
- return e;
- }
- // 删除目前元素
- public void remove() {
- if (current == null)
- throw new IllegalStateException();
- if (modCount != expectedModCount)
- throw new ConcurrentModificationException();
- Object k = current.key;
- current = null;
- HashMap.this.removeEntryForKey(k);
- expectedModCount = modCount;
- }
- }
- // value的疊代器
- private final class ValueIterator extends HashIterator<V> {
- public V next() {
- return nextEntry().value;
- }
- }
- // key的疊代器
- private final class KeyIterator extends HashIterator<K> {
- public K next() {
- return nextEntry().getKey();
- }
- }
- // Entry的疊代器
- private final class EntryIterator extends HashIterator<Map.Entry<K,V>> {
- public Map.Entry<K,V> next() {
- return nextEntry();
- }
- }
- // 傳回一個“key疊代器”
- Iterator<K> newKeyIterator() {
- return new KeyIterator();
- }
- // 傳回一個“value疊代器”
- Iterator<V> newValueIterator() {
- return new ValueIterator();
- }
- // 傳回一個“entry疊代器”
- Iterator<Map.Entry<K,V>> newEntryIterator() {
- return new EntryIterator();
- }
- // HashMap的Entry對應的集合
- private transient Set<Map.Entry<K,V>> entrySet = null;
- // 傳回“key的集合”,實際上傳回一個“KeySet對象”
- public Set<K> keySet() {
- Set<K> ks = keySet;
- return (ks != null ? ks : (keySet = new KeySet()));
- }
- // Key對應的集合
- // KeySet繼承于AbstractSet,說明該集合中沒有重複的Key。
- private final class KeySet extends AbstractSet<K> {
- public Iterator<K> iterator() {
- return newKeyIterator();
- }
- public int size() {
- return size;
- }
- public boolean contains(Object o) {
- return containsKey(o);
- }
- public boolean remove(Object o) {
- return HashMap.this.removeEntryForKey(o) != null;
- }
- public void clear() {
- HashMap.this.clear();
- }
- }
- // 傳回“value集合”,實際上傳回的是一個Values對象
- public Collection<V> values() {
- Collection<V> vs = values;
- return (vs != null ? vs : (values = new Values()));
- }
- // “value集合”
- // Values繼承于AbstractCollection,不同于“KeySet繼承于AbstractSet”,
- // Values中的元素能夠重複。因為不同的key可以指向相同的value。
- private final class Values extends AbstractCollection<V> {
- public Iterator<V> iterator() {
- return newValueIterator();
- }
- public int size() {
- return size;
- }
- public boolean contains(Object o) {
- return containsValue(o);
- }
- public void clear() {
- HashMap.this.clear();
- }
- }
- // 傳回“HashMap的Entry集合”
- public Set<Map.Entry<K,V>> entrySet() {
- return entrySet0();
- }
- // 傳回“HashMap的Entry集合”,它實際是傳回一個EntrySet對象
- private Set<Map.Entry<K,V>> entrySet0() {
- Set<Map.Entry<K,V>> es = entrySet;
- return es != null ? es : (entrySet = new EntrySet());
- }
- // EntrySet對應的集合
- // EntrySet繼承于AbstractSet,說明該集合中沒有重複的EntrySet。
- private final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
- public Iterator<Map.Entry<K,V>> iterator() {
- return newEntryIterator();
- }
- public boolean contains(Object o) {
- if (!(o instanceof Map.Entry))
- return false;
- Map.Entry<K,V> e = (Map.Entry<K,V>) o;
- Entry<K,V> candidate = getEntry(e.getKey());
- return candidate != null && candidate.equals(e);
- }
- public boolean remove(Object o) {
- return removeMapping(o) != null;
- }
- public int size() {
- return size;
- }
- public void clear() {
- HashMap.this.clear();
- }
- }
- // java.io.Serializable的寫入函數
- // 将HashMap的“總的容量,實際容量,所有的Entry”都寫入到輸出流中
- private void writeObject(java.io.ObjectOutputStream s)
- throws IOException
- {
- Iterator<Map.Entry<K,V>> i =
- (size > 0) ? entrySet0().iterator() : null;
- // Write out the threshold, loadfactor, and any hidden stuff
- s.defaultWriteObject();
- // Write out number of buckets
- s.writeInt(table.length);
- // Write out size (number of Mappings)
- s.writeInt(size);
- // Write out keys and values (alternating)
- if (i != null) {
- while (i.hasNext()) {
- Map.Entry<K,V> e = i.next();
- s.writeObject(e.getKey());
- s.writeObject(e.getValue());
- }
- }
- }
- private static final long serialVersionUID = 362498820763181265L;
- // java.io.Serializable的讀取函數:根據寫入方式讀出
- // 将HashMap的“總的容量,實際容量,所有的Entry”依次讀出
- private void readObject(java.io.ObjectInputStream s)
- throws IOException, ClassNotFoundException
- {
- // Read in the threshold, loadfactor, and any hidden stuff
- s.defaultReadObject();
- // Read in number of buckets and allocate the bucket array;
- int numBuckets = s.readInt();
- table = new Entry[numBuckets];
- init(); // Give subclass a chance to do its thing.
- // Read in size (number of Mappings)
- int size = s.readInt();
- // Read the keys and values, and put the mappings in the HashMap
- for (int i=0; i<size; i++) {
- K key = (K) s.readObject();
- V value = (V) s.readObject();
- putForCreate(key, value);
- }
- }
- // 傳回“HashMap總的容量”
- int capacity() { return table.length; }
- // 傳回“HashMap的加載因子”
- float loadFactor() { return loadFactor; }
- }
幾點總結
1、首先要清楚HashMap的存儲結構,如下圖所示:
圖中,紫色部分即代表哈希表,也稱為哈希數組,數組的每個元素都是一個單連結清單的頭節點,連結清單是用來解決沖突的,如果不同的key映射到了數組的同一位置處,就将其放入單連結清單中。
2、首先看連結清單中節點的資料結構:
[java] view plain copy
- // Entry是單向連結清單。
- // 它是 “HashMap鍊式存儲法”對應的連結清單。
- // 它實作了Map.Entry 接口,即實作getKey(), getValue(), setValue(V value), equals(Object o), hashCode()這些函數
- static class Entry<K,V> implements Map.Entry<K,V> {
- final K key;
- V value;
- // 指向下一個節點
- Entry<K,V> next;
- final int hash;
- // 構造函數。
- // 輸入參數包括"哈希值(h)", "鍵(k)", "值(v)", "下一節點(n)"
- Entry(int h, K k, V v, Entry<K,V> n) {
- value = v;
- next = n;
- key = k;
- hash = h;
- }
- public final K getKey() {
- return key;
- }
- public final V getValue() {
- return value;
- }
- public final V setValue(V newValue) {
- V oldValue = value;
- value = newValue;
- return oldValue;
- }
- // 判斷兩個Entry是否相等
- // 若兩個Entry的“key”和“value”都相等,則傳回true。
- // 否則,傳回false
- public final boolean equals(Object o) {
- if (!(o instanceof Map.Entry))
- return false;
- Map.Entry e = (Map.Entry)o;
- Object k1 = getKey();
- Object k2 = e.getKey();
- if (k1 == k2 || (k1 != null && k1.equals(k2))) {
- Object v1 = getValue();
- Object v2 = e.getValue();
- if (v1 == v2 || (v1 != null && v1.equals(v2)))
- return true;
- }
- return false;
- }
- // 實作hashCode()
- public final int hashCode() {
- return (key==null ? 0 : key.hashCode()) ^
- (value==null ? 0 : value.hashCode());
- }
- public final String toString() {
- return getKey() + "=" + getValue();
- }
- // 當向HashMap中添加元素時,繪調用recordAccess()。
- // 這裡不做任何處理
- void recordAccess(HashMap<K,V> m) {
- }
- // 當從HashMap中删除元素時,繪調用recordRemoval()。
- // 這裡不做任何處理
- void recordRemoval(HashMap<K,V> m) {
- }
- }
它的結構元素除了key、value、hash外,還有next,next指向下一個節點。另外,這裡覆寫了equals和hashCode方法來保證鍵值對的獨一無二。
3、HashMap共有四個構造方法。構造方法中提到了兩個很重要的參數:初始容量和加載因子。這兩個參數是影響HashMap性能的重要參數,其中容量表示哈希表中槽的數量(即哈希數組的長度),初始容量是建立哈希表時的容量(從構造函數中可以看出,如果不指明,則預設為16),加載因子是哈希表在其容量自動增加之前可以達到多滿的一種尺度,當哈希表中的條目數超出了加載因子與目前容量的乘積時,則要對該哈希表進行 resize 操作(即擴容)。
下面說下加載因子,如果加載因子越大,對空間的利用更充分,但是查找效率會降低(連結清單長度會越來越長);如果加載因子太小,那麼表中的資料将過于稀疏(很多空間還沒用,就開始擴容了),對空間造成嚴重浪費。如果我們在構造方法中不指定,則系統預設加載因子為0.75,這是一個比較理想的值,一般情況下我們是無需修改的。
另外,無論我們指定的容量為多少,構造方法都會将實際容量設為不小于指定容量的2的次方的一個數,且最大值不能超過2的30次方
4、HashMap中key和value都允許為null。
5、要重點分析下HashMap中用的最多的兩個方法put和get。先從比較簡單的get方法着手,源碼如下:
[java] view plain copy
- // 擷取key對應的value
- public V get(Object key) {
- if (key == null)
- return getForNullKey();
- // 擷取key的hash值
- int hash = hash(key.hashCode());
- // 在“該hash值對應的連結清單”上查找“鍵值等于key”的元素
- for (Entry<K,V> e = table[indexFor(hash, table.length)];
- e != null;
- e = e.next) {
- Object k;
- /判斷key是否相同
- if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
- return e.value;
- }
- 沒找到則傳回null
- return null;
- }
- // 擷取“key為null”的元素的值
- // HashMap将“key為null”的元素存儲在table[0]位置,但不一定是該連結清單的第一個位置!
- private V getForNullKey() {
- for (Entry<K,V> e = table[0]; e != null; e = e.next) {
- if (e.key == null)
- return e.value;
- }
- return null;
- }
首先,如果key為null,則直接從哈希表的第一個位置table[0]對應的連結清單上查找。記住,key為null的鍵值對永遠都放在以table[0]為頭結點的連結清單中,當然不一定是存放在頭結點table[0]中。
如果key不為null,則先求的key的hash值,根據hash值找到在table中的索引,在該索引對應的單連結清單中查找是否有鍵值對的key與目标key相等,有就傳回對應的value,沒有則傳回null。
put方法稍微複雜些,代碼如下:
[java] view plain copy
- // 将“key-value”添加到HashMap中
- public V put(K key, V value) {
- // 若“key為null”,則将該鍵值對添加到table[0]中。
- if (key == null)
- return putForNullKey(value);
- // 若“key不為null”,則計算該key的哈希值,然後将其添加到該哈希值對應的連結清單中。
- int hash = hash(key.hashCode());
- int i = indexFor(hash, table.length);
- for (Entry<K,V> e = table[i]; e != null; e = e.next) {
- Object k;
- // 若“該key”對應的鍵值對已經存在,則用新的value取代舊的value。然後退出!
- if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
- // 若“該key”對應的鍵值對不存在,則将“key-value”添加到table中
- modCount++;
- //将key-value添加到table[i]處
- addEntry(hash, key, value, i);
- return null;
- }
如果key為null,則将其添加到table[0]對應的連結清單中,putForNullKey的源碼如下:
[java] view plain copy
- // putForNullKey()的作用是将“key為null”鍵值對添加到table[0]位置
- private V putForNullKey(V value) {
- for (Entry<K,V> e = table[0]; e != null; e = e.next) {
- if (e.key == null) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
- // 如果沒有存在key為null的鍵值對,則直接題阿見到table[0]處!
- modCount++;
- addEntry(0, null, value, 0);
- return null;
- }
如果key不為null,則同樣先求出key的hash值,根據hash值得出在table中的索引,而後周遊對應的單連結清單,如果單連結清單中存在與目标key相等的鍵值對,則将新的value覆寫舊的value,比将舊的value傳回,如果找不到與目标key相等的鍵值對,或者該單連結清單為空,則将該鍵值對插入到改單連結清單的頭結點位置(每次新插入的節點都是放在頭結點的位置),該操作是有addEntry方法實作的,它的源碼如下:
[java] view plain copy
- // 新增Entry。将“key-value”插入指定位置,bucketIndex是位置索引。
- void addEntry(int hash, K key, V value, int bucketIndex) {
- // 儲存“bucketIndex”位置的值到“e”中
- Entry<K,V> e = table[bucketIndex];
- // 設定“bucketIndex”位置的元素為“新Entry”,
- // 設定“e”為“新Entry的下一個節點”
- table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
- // 若HashMap的實際大小 不小于 “門檻值”,則調整HashMap的大小
- if (size++ >= threshold)
- resize(2 * table.length);
- }
注意這裡倒數第三行的構造方法,将key-value鍵值對賦給table[bucketIndex],并将其next指向元素e,這便将key-value放到了頭結點中,并将之前的頭結點接在了它的後面。該方法也說明,每次put鍵值對的時候,總是将新的該鍵值對放在table[bucketIndex]處(即頭結點處)。
兩外注意最後兩行代碼,每次加入鍵值對時,都要判斷目前已用的槽的數目是否大于等于閥值(容量*加載因子),如果大于等于,則進行擴容,将容量擴為原來容量的2倍。
6、關于擴容。上面我們看到了擴容的方法,resize方法,它的源碼如下:
[java] view plain copy
- // 重新調整HashMap的大小,newCapacity是調整後的機關
- void resize(int newCapacity) {
- Entry[] oldTable = table;
- int oldCapacity = oldTable.length;
- if (oldCapacity == MAXIMUM_CAPACITY) {
- threshold = Integer.MAX_VALUE;
- return;
- }
- // 建立一個HashMap,将“舊HashMap”的全部元素添加到“新HashMap”中,
- // 然後,将“新HashMap”指派給“舊HashMap”。
- Entry[] newTable = new Entry[newCapacity];
- transfer(newTable);
- table = newTable;
- threshold = (int)(newCapacity * loadFactor);
- }
很明顯,是建立了一個HashMap的底層數組,而後調用transfer方法,将就HashMap的全部元素添加到新的HashMap中(要重新計算元素在新的數組中的索引位置)。transfer方法的源碼如下:
[java] view plain copy
- // 将HashMap中的全部元素都添加到newTable中
- void transfer(Entry[] newTable) {
- Entry[] src = table;
- int newCapacity = newTable.length;
- for (int j = 0; j < src.length; j++) {
- Entry<K,V> e = src[j];
- if (e != null) {
- src[j] = null;
- do {
- Entry<K,V> next = e.next;
- int i = indexFor(e.hash, newCapacity);
- e.next = newTable[i];
- newTable[i] = e;
- e = next;
- } while (e != null);
- }
- }
- }
很明顯,擴容是一個相當耗時的操作,因為它需要重新計算這些元素在新的數組中的位置并進行複制處理。是以,我們在用HashMap的時,最好能提前預估下HashMap中元素的個數,這樣有助于提高HashMap的性能。
7、注意containsKey方法和containsValue方法。前者直接可以通過key的哈希值将搜尋範圍定位到指定索引對應的連結清單,而後者要對哈希數組的每個連結清單進行搜尋。
8、我們重點來分析下求hash值和索引值的方法,這兩個方法便是HashMap設計的最為核心的部分,二者結合能保證哈希表中的元素盡可能均勻地散列。
計算哈希值的方法如下:
[java] view plain copy
- static int hash(int h) {
- h ^= (h >>> 20) ^ (h >>> 12);
- return h ^ (h >>> 7) ^ (h >>> 4);
- }
它隻是一個數學公式,IDK這樣設計對hash值的計算,自然有它的好處,至于為什麼這樣設計,我們這裡不去追究,隻要明白一點,用的位的操作使hash值的計算效率很高。
由hash值找到對應索引的方法如下:
[java] view plain copy
- static int indexFor(int h, int length) {
- return h & (length-1);
- }
這個我們要重點說下,我們一般對哈希表的散列很自然地會想到用hash值對length取模(即除法散列法),Hashtable中也是這樣實作的,這種方法基本能保證元素在哈希表中散列的比較均勻,但取模會用到除法運算,效率很低,HashMap中則通過h&(length-1)的方法來代替取模,同樣實作了均勻的散列,但效率要高很多,這也是HashMap對Hashtable的一個改進。
接下來,我們分析下為什麼哈希表的容量一定要是2的整數次幂。首先,length為2的整數次幂的話,h&(length-1)就相當于對length取模,這樣便保證了散列的均勻,同時也提升了效率;其次,length為2的整數次幂的話,為偶數,這樣length-1為奇數,奇數的最後一位是1,這樣便保證了h&(length-1)的最後一位可能為0,也可能為1(這取決于h的值),即與後的結果可能為偶數,也可能為奇數,這樣便可以保證散列的均勻性,而如果length為奇數的話,很明顯length-1為偶數,它的最後一位是0,這樣h&(length-1)的最後一位肯定為0,即隻能為偶數,這樣任何hash值都隻會被散列到數組的偶數下标位置上,這便浪費了近一半的空間,是以,length取2的整數次幂,是為了使不同hash值發生碰撞的機率較小,這樣就能使元素在哈希表中均勻地散列。