HashMap源碼

1.1 包含的屬性

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
    // 序列号
    private static final long serialVersionUID = 362498820763181265L;
    
    // 預設的初始容量是16
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
    
    // 最大容量
    static final int MAXIMUM_CAPACITY = 1 << 30;
    
    // 預設的填充因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    
    // 當桶(bucket)上的結點數大于這個值時會轉成紅黑樹
    static final int TREEIFY_THRESHOLD = 8;
    
    // 當桶(bucket)上的結點數小于這個值時樹轉連結清單
    static final int UNTREEIFY_THRESHOLD = 6;
    
    // 桶中結構轉化為紅黑樹對應的table的最小容量
    static final int MIN_TREEIFY_CAPACITY = 64;
    
    // 存儲元素的數組，總是2的幂次倍
    transient Node<k,v>[] table;
    
    // 存放具體元素的集
    transient Set<map.entry<k,v>> entrySet;
    
    // 存放元素的個數，注意這個不等于數組的長度。
    transient int size;
    
    // 每次擴容和更改map結構的計數器
    transient int modCount;
    
    // 臨界值(容量*填充因子) 當實際大小超過臨界值時，會進行擴容
    int threshold;
    
    // 加載因子
    final float loadFactor;
}

loadFactor 加載因子

loadFactor 加載因子是控制數組存放資料的疏密程度，loadFactor 越趨近于 1，那麼數組中存放的資料(entry)也就越多，也就越密，也就是會讓連結清單的長度增加，loadFactor 越小，也就是趨近于 0，數組中存放的資料(entry)也就越少，也就越稀疏。

給定的預設容量為
16 ，負載因子為 0.75 。Map 在使用過程中不斷的往裡面存放資料，當數量達到了 16 * 0.75 = 12 就需要将目前 16
的容量進行擴容，而擴容這個過程涉及到 rehash、複制資料等操作，是以非常消耗性能。

loadFactor 太大導緻查找元素效率低，太小導緻數組的使用率低，存放的資料會很分散。loadFactor 的預設值為 0.75f 是官方給出的一個比較好的臨界值。

理想情況下，在随機 hashCodes 下，桶中節點的頻率遵循泊松分布，預設調整大小門檻值為 0.75，參數平均約為 0.5，盡管由于調整大小粒度而存在很大差異。

**當門檻值為0.75，泊松分布的參數為0.5時，桶中元素超過8的機率極低

HashMap源碼
threshold

threshold = capacity * loadFactor，當 Size>=threshold的時候，那麼就要考慮對數組的擴增了，也就是說，這個的意思就是衡量數組是否需要擴增的一個标準。

1.2 構造器

public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // 16
}

public HashMap(int initialCapacity) {
        //this(16,0.75)
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
}


public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
}

/**
* 構造一個具有指定初始容量和負載因子的空 HashMap。
  參數：
    initialCapacity - 初始容量
    loadFactor – 負載因子
  抛出：
    IllegalArgumentException – 如果初始容量為負或負載因子為非正
*/
public HashMap(int initialCapacity, float loadFactor) {
    //異常檢測
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    //指派負載因子
    this.loadFactor = loadFactor;
    //計算容量，并将容量指派給門檻值
    this.threshold = tableSizeFor(initialCapacity);
}

/**
 * 傳回給定目标容量的 2 次方。
 */
static final int tableSizeFor(int cap) {
    int n = -1 >>> Integer.numberOfLeadingZeros(cap - 1);
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

1.3 hash方法源碼

static final int hash(Object key) {
      int h;
      // key.hashCode()：傳回散列值也就是hashcode
      // ^ ：按位異或
      // >>>:無符号右移，忽略符号位，空位都以0補齊
      return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
  }

HashMap 通過 key 的 hashCode 經過擾動函數處理過後得到 hash 值，然後通過 (n - 1) & hash 判斷目前元素存放的位置，使用 hash 方法也就是擾動函數是為了防止一些實作比較差的 hashCode() 方法換句話說使用擾動函數之後可以減少碰撞。
這裡的 Hash 算法本質上就是三步：取key的 hashCode 值、根據 hashcode 計算出hash值、通過取模計算下标。
擾動hash的好處
- 當n比較小時，hash隻有低16位參與了計算，高位的計算可以認為是無效的。這樣導緻了計算結果隻與低位資訊有關，高位資料沒發揮作用。為了處理這個缺陷，我們可以讓 hash 高16位資料與低16位資料進行異或運算，通過這種方式，讓高位資料與低位資料進行異或，讓高位資料參與到計算中
- 增加 hash 的複雜度。當覆寫的 hashCode 方法分布性不佳時， hash 的沖突率比較高。通過移位和異或運算，可以讓 hash 變得更複雜，進而影響 hash 的分布性。

1.4 put源碼

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // table未初始化或者長度為0，進行擴容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // (n - 1) & hash 确定元素存放在哪個桶中，桶為空，新生成結點放入桶中
    //(此時，這個結點是放在數組中)
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    // 桶中已經存在元素
    else {
        Node<K,V> e; K k;
        // 如果鍵的值以及節點 hash 等于連結清單中的第一個鍵值對節點時，則将 e 指向該鍵值對
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一個元素指派給e，用e來記錄
                e = p;
        // hash值不相等，即key不相等；為紅黑樹結點
        else if (p instanceof TreeNode)
            // 放入樹中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 為連結清單結點
        else {
            // 在連結清單最末插入結點
            for (int binCount = 0; ; ++binCount) {
                // 到達連結清單的尾部
                if ((e = p.next) == null) {
                    // 在尾部插入新結點
                    p.next = newNode(hash, key, value, null);
                    // 結點數量達到門檻值(預設為 8 )，執行 treeifyBin 方法
                    // 這個方法會根據 HashMap 數組來決定是否轉換為紅黑樹。
                    // 隻有當數組長度大于或者等于 64 的情況下，才會執行轉換紅黑樹操作，
                    //以減少搜尋時間。否則，就是隻是對數組擴容。
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    // 跳出循環
                    break;
                }
                // 判斷連結清單中結點的key值與插入的元素的key值是否相等
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    // 相等，跳出循環
                    break;
                // 用于周遊桶中的連結清單，與前面的e = p.next組合，可以周遊連結清單
                p = e;
            }
        }
        // 表示在桶中找到key值、hash值與插入元素相等的結點
        if (e != null) {
            // 記錄e的value
            V oldValue = e.value;
            // onlyIfAbsent為false或者舊值為null
            if (!onlyIfAbsent || oldValue == null)
                //用新值替換舊值
                e.value = value;
            // 通路後回調
            afterNodeAccess(e);
            // 傳回舊值
            return oldValue;
        }
    }
    // 結構性修改
    ++modCount;
    // 實際大小大于門檻值則擴容
    if (++size > threshold)
        resize();
    // 插入後回調
    afterNodeInsertion(evict);
    return null;
}

1.5 resize源碼

HashMap 按目前桶數組長度的2倍進行擴容，門檻值也變為原來的2倍（如果計算過程中，門檻值溢出歸零，則按門檻值公式重新計算）

final Node<K,V>[] resize() {
    //儲存舊map
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length; //舊數組的容量
    int oldThr = threshold; //舊數組的門檻值
    int newCap, newThr = 0; //初始化新容量和新門檻值
    // 如果 table 不為空，表明已經初始化過了
    if (oldCap > 0) {
        // 當 table 容量超過容量最大值，則不再擴容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        } 
        // 否則，按舊容量和門檻值的2倍計算新容量和門檻值的大小
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    } else if (oldThr > 0) // 桶未初始化，且舊門檻值大于0
        /*
         * 初始化時，将 threshold 的值指派給 newCap，
         * HashMap 使用 threshold 變量暫時儲存 initialCapacity 參數的值
         */ 
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        /*
         * 調用無參構造方法時，桶數組容量為預設容量，
         * 門檻值為預設容量與預設負載因子乘積
         */
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    
    // 由于newThr是移位計算，是以可能為0，newThr 為 0 時，按門檻值計算公式進行計算
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    // 建立新的桶數組，桶數組的初始化也是在這裡完成的
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        // 如果舊的桶數組不為空，則周遊桶數組，并将鍵值對映射到新的桶數組中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null) //如果桶中隻有一個節點
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode) //若無紅黑樹
                    // 重新映射時，需要對紅黑樹進行拆分
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order //若無連結清單
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 周遊連結清單，并将連結清單節點按原順序進行分組
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 将分組後的連結清單映射到新桶中
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

在 JDK 1.8 中，重新映射節點需要考慮節點類型。對于樹形節點，需先拆分紅黑樹再映射。對于連結清單類型節點，則需先對連結清單進行分組，然後再映射

1.6 table 變量為什麼用transient 修飾

HashMap 并沒有使用預設的序列化機制，而是自己實作了

readObject和writeObject

兩個方法自定義了序列化的内容

table 多數情況下是無法被存滿的，序列化未使用的部分，浪費空間
同一個鍵值對在不同 JVM 下，所處的桶位置可能是不同的，在不同的 JVM 下反序列化 table 可能會發生錯誤。

HashMap源碼

HashMap源碼

目錄

1.1 包含的屬性

1.2 構造器

1.3 hash方法源碼

1.4 put源碼

1.5 resize源碼

1.6 table 變量為什麼用transient 修飾