ConcurrentHashMap源碼解析_03 put方法源碼分析

JDK1.8 ConcurrentHashMap結構圖：

  ConcurrentHashMap源碼解析_03 put方法源碼分析

1、put方法源碼解析

// 向并發Map中put一個資料
public V put(K key, V value) {
    return putVal(key, value, false);
}

// 向并發Map中put一個資料
// Key: 資料的鍵
// value：資料的值
// onlyIfAbsent：是否替換資料：
// 如果為false，則當put資料時，遇到Map中有相同K,V的資料，則将其替換
// 如果為true，則當put資料時，遇到Map中有相同K,V的資料，則不做替換，不插入
final V putVal(K key, V value, boolean onlyIfAbsent) {
    // 控制k 和 v 不能為null
    if (key == null || value == null) throw new NullPointerException();
    // 通過spread方法，可以讓高位也能參與進尋址運算，使最終得到的hash值更分散
    int hash = spread(key.hashCode());
    
    // binCount表示目前k-v 封裝成node插入到指定桶位後，在桶位中的所屬連結清單的下标位置
    // =0 表示目前桶位為null，node可以直接放入
    // >0 表示目前桶位中有節點，周遊連結清單，将封裝k-v的新node放傳入連結表末尾，并記錄連結清單末尾的下标binCount
    // =2 表示目前桶位**可能**已經樹化為紅黑樹了
    int binCount = 0;
    
    // tab 引用map對象的table
    // 自旋
    for (Node<K,V>[] tab = table;;) {
        // f 表示桶位的頭結點
        // n 表示散清單數組的長度
        // i 表示key通過尋址計算後，得到的桶位下标
        // fh 表示桶位頭結點的hash值
        Node<K,V> f; int n, i, fh;
        // -----------------------------------------------------------------------------
        // CASE1：成立，表示目前map中的table尚未初始化...
        if (tab == null || (n = tab.length) == 0)
            // 對map中的table進行初始化
            tab = initTable();
        // -----------------------------------------------------------------------------
        // CASE2：table已經初始化，此時根據尋址算法确定一個桶，并且桶的頭結點f為null
        // i 表示key使用路由尋址算法得到key對應table數組的下标位置，tabAt方法擷取指定桶位i的頭結點f
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 這時候就可以将封裝k-v的結點直接放入桶
            // casTabAt通過CAS的方式去向Node數組指定位置i設定節點值，設定成功傳回true 否則傳回false
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;
        }
        // -----------------------------------------------------------------------------
        // CASE3：table已經初始化，尋址得到的桶位中的頭結點f不是null，如果該頭結點f的hash值fh=-1：
        // 則，表示目前節點是FWD(forwarding)節點
        // 如果CASE3條件成立：表示目前桶位的頭結點為 FWD結點，表示目前map正處于擴容過程中..
        else if ((fh = f.hash) == MOVED)
            // 發現f是FWD結點後，目前結點有義務去幫助目前map對象完成資料遷移工作...
            // 等學完擴容再來分析這裡~
            tab = helpTransfer(tab, f);
        // -----------------------------------------------------------------------------
        // CASE4：CASE1-3都不滿足時，那麼目前桶位存放的可能是連結清單也可能是紅黑樹代理結點TreeBin
        else {
            // 保留替換之前的資料引用：當新插入的key存在後，會将舊值賦給OldVal，傳回給put方法調用
            V oldVal = null;
            // 使用synchronized加鎖“頭節點”（**理論上是“頭結點”**)
            synchronized (f) {
                // -----------------------------------------------------------------------
                // CASE5：tabAt(tab, i) == f
                // 對比一下目前桶位的頭節點是否為之前擷取的頭結點：為什麼又要對比一下？
                // 如果其它線程在目前線程之前将該桶位的頭結點修改掉了，目前線程再使用sync對該節點f加鎖就有問題了（鎖本身加錯了地方~） 
                if (tabAt(tab, i) == f) {// 如果條件成立，說明加鎖的對象f沒有問題，持有鎖！
                    // ------------------------------------------------------------------
                    // CASE6：fh >= 0)
                    // 如果條件成立，說明目前桶位就是普通連結清單桶位,這裡回顧下常量屬性字段：
                    // static final int MOVED = -1; 表示目前節點是FWD(forwarding)節點
                    // static final int TREEBIN = -2; 表示目前節點已經樹化
                    if (fh >= 0) {
                        // 1.目前插入key與連結清單當中所有元素的key都不一緻時，目前的插入操作是追加到連結清單的末尾，binCount此時表示連結清單長度
                        // 2.目前插入key與連結清單當中的某個元素的key一緻時，目前插入操作可能就是替換了。binCount表示沖突位置（binCount - 1）
                        binCount = 1;
                        // 疊代循環目前桶位的連結清單，e是每次循環處理節點。
                        for (Node<K,V> e = f;; ++binCount) {
                            // 目前循環周遊節點的key
                            K ek;
                            // --------------------------------------------------------
                            // CASE7：
                            // 條件一：e.hash == hash
                            // 成立：表示循環的目前元素的hash值與插入節點的hash值一緻,需要進一步判斷
                            // 條件二：((ek = e.key) == key ||(ek != null && key.equals(ek)))
                            // 成立：說明循環的目前節點與插入節點的key一緻，确實發生沖突了~
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                // 将目前循環的元素的值指派給oldVal
                                oldVal = e.val;
                                // 傳入的putVal方法參數onlyIfAbsent：是否替換資料：
                                // false，當put資料時，遇到Map中有相同K,V的資料，則将其替換
                                // true，當put資料時，遇到Map中有相同K,V的資料，則不做替換，不插入
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            // --------------------------------------------------------
                            // CASE8：
                            // 目前元素與插入元素的key不一緻時，會走下面程式:
                            // 1.更新循環周遊的節點為目前節點的下一個節點
                            // 2.判斷下一個節點是否為null，如果是null，說明目前節點已經是隊尾了，插入資料需要追加到隊尾節點的後面。
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    // ------------------------------------------------------------------
                    // CASE9：f instanceof TreeBin
                    // 如果條件成立，表示目前桶位是紅黑樹代理結點TreeBin
                    //（前置條件：該桶位一定不是連結清單）
                    else if (f instanceof TreeBin) {
                        // p表示紅黑樹中如果與你插入節點的key 有沖突節點的話，則putTreeVal方法會傳回沖突節點的引用。
                        Node<K,V> p;
                        // 強制設定binCount為2，因為binCount <= 1 時有其它含義，是以這裡設定為了2 （回頭講addCount的時候會詳細介紹）
                        binCount = 2;
                        
                        // 條件一成立，說明目前插入節點的key與紅黑樹中的某個節點的key一緻，沖突了：
                        // putTreeVal向紅黑樹中插入結點，插入成功傳回null，否則傳回沖突結點對象
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            // 将沖突節點的值指派給oldVal
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            // ------------------------------------------------------------------
            // CASE10：binCount != 0
            // 說明目前桶位不為null，可能是紅黑樹也可能是連結清單
            if (binCount != 0) {
                // 如果binCount>=8 表示處理的桶位一定是連結清單
                if (binCount >= TREEIFY_THRESHOLD)
                    // 因為桶中連結清單長度大于了8，需要樹化：
                    // 調用轉化連結清單為紅黑樹的方法
                    treeifyBin(tab, i);
                // 說明目前線程插入的資料key，與原有k-v發生沖突，需要将原資料v傳回給調用者。
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    // Map中的元素資料量累加方法：有額外的以下功能
    // 1.統計目前table一共有多少資料
    // 2.并判斷是否達到擴容門檻值标準，觸發擴容。
    addCount(1L, binCount);
    
    return null;
}

2、initTable方法源碼分析

第一次放元素時，初始化桶數組：

/** 
 * table初始化
 */
private final Node<K,V>[] initTable() {
    // tab: 引用map.table
    // sc: sizeCtl的臨時值
    // sizeCtl：預設為0，用來控制table的狀态、以及初始化和擴容操作:
    // sizeCtl<0表示table的狀态:
    //（1）=-1，表示有其他線程正在進行初始化操作。（其他線程就不能再進行初始化，相當于一把鎖）
    //（2）=-(1 + nThreads)，表示有n個線程正在一起擴容。
    // sizeCtl>=0表示table的初始化和擴容相關操作：
    //（3）=0，預設值，後續在真正初始化table的時候使用，設定為預設容量DEFAULT_CAPACITY --> 16。
    //（4）>0，将sizeCtl設定為table初始容量或擴容完成後的下一次擴容的門檻。
    Node<K,V>[] tab; int sc;
    
    // 附加條件的自旋： 條件是map.table尚未初始化...
    while ((tab = table) == null || tab.length == 0) {
        // -----------------------------------------------------------------------------
        // CASE1: sizeCtl) < 0
        // sizeCtl < 0可能是以下2種情況：
        //（1）-1，表示有其他線程正在進行table初始化操作。
        //（2）-(1 + nThreads)，表示有n個線程正在一起擴容。
        if ((sc = sizeCtl) < 0)
            // 這裡sizeCtl大機率就是-1，表示其它線程正在進行建立table的過程，目前線程沒有競争到初始化table的鎖，進而目前線程被迫等待...
            Thread.yield();
        // -----------------------------------------------------------------------------
        // CASE2：sizeCtl) >= 0 且U.compareAndSwapInt(this, SIZECTL, sc, -1)結果為true
        // U.compareAndSwapInt(this, SIZECTL, sc, -1)：以CAS的方式修改目前線程的sizeCtl為-1，
        // sizeCtl如果成功被修改為-1，就傳回true，否則傳回false。
        // 當傳回true時，則該線程就可以進入下面的else if代碼塊中，這時候sizeCtl=-1相當于是一把鎖，表示下面的else if代碼塊已經被該線程占用，其他線程不能再進入~
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                // ----------------------------------------------------------------------
                // CASE3: 這裡為什麼又要判斷呢？ 
                // 為了防止其它線程已經初始化table完畢了，然後目前線程再次對其初始化..導緻丢失資料。
                // 如果條件成立，說明其它線程都沒有進入過這個if塊，目前線程就是具備初始化table權利了。
                if ((tab = table) == null || tab.length == 0) {
                    // sc大于等于0的情況如下：
                    //（3）=0，預設值，後續在真正初始化table的時候使用，設定為預設容量DEFAULT_CAPACITY --> 16。
                    //（4）>0，将sizeCtl設定為table初始容量或擴容完成後的下一次擴容的門檻。
                    // 如果sc大于0,則建立table時使用sc為指定table初始容量大小，
                    // 否則使用16預設值DEFAULT_CAPACITY
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    // 建立新數組nt
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    // 将新數組nt指派給table、tab
                    table = tab = nt;
                    // sc設定為下次散清單擴容的門檻：0.75n
                    sc = n - (n >>> 2);
                }
            } finally {
                // 将sc指派給sizeCtl，分為一下2種情況：
                // 1、目前線程既通過了CASE2的判斷，也通過了CASE3的判斷：
                // 則，目前線程是第一次建立map.table的線程，那麼，sc就表示下一次擴容的門檻值。
                // 2、當線程通過了CASE2的判斷，但是沒有通過CASE3的判斷：
                // 則，目前線程并不是第一次建立map.table的線程，目前線程通過CASE2的判斷時，将
                // sizeCtl設定為了-1 ，那麼在該線程結束上面的代碼邏輯之後，需要将sc修改回進入CASE2之前的sc值。
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

小節：

（1）使用CAS鎖控制隻有一個線程初始化桶數組；

（2）sizeCtl在初始化後存儲的是擴容門檻；

（3）擴容門檻寫死的是桶數組大小的0.75倍，桶數組大小即map的容量，也就是最多存儲多少個元素。

3、addCount方法(難點)

在閱讀addCount方法源碼之前，最好再去熟悉下LongAdder源碼：LongAdder源碼解析。

addCount方法作用：每次添加元素後，元素數量加1，并判斷是否達到擴容門檻，達到了則進行擴容或協助擴容。

/**
 * Map中的元素資料量累加方法：有額外的以下功能
 * 1.統計目前table一共有多少資料
 * 2.并判斷是否達到擴容門檻值标準，觸發擴容
 */
private final void addCount(long x, int check) {
    // as 表示 LongAdder.cells
    // b 表示LongAdder.base
    // s 表示目前map.table中元素的數量
    CounterCell[] as; long b, s;
    // -------------------------統計目前table一共有多少資料----------------------------------
    // CASE1: 
    // (as = counterCells) != null
    // 條件一：true->表示cells已經初始化了，目前線程應該去使用hash尋址找到合适的cell 去累加資料
    //        false->表示目前線程應該直接将資料累加到base（沒有線程競争）
    // !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)
    // 條件二：false->表示寫base成功，資料累加到base中了，目前競争不激烈，不需要建立cells
    //        true->表示寫base失敗，與其他線程在base上發生了競争，目前線程應該去嘗試建立cells。
    if ((as = counterCells) != null ||
        !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
        // 有幾種情況進入到if塊中？
        // 條件一為true->表示cells已經初始化了，目前線程應該去使用hash尋址找到合适的cell去累加資料
        // 條件二為true->表示寫base失敗，與其他線程在base上發生了競争，目前線程應該去嘗試建立cells。

        // a 表示目前線程hash尋址命中的cell
        CounterCell a;
        // v 表示目前線程寫cell時的期望值
        long v;
        // m 表示目前cells數組的長度
        int m;
        // true -> 未發生線程競争  false->發生線程競争
        boolean uncontended = true;

        // ---------------------------------------------------------------------------
        // CASE2: 
        // 條件一：as == null || (m = as.length - 1) < 0
        // true-> 表示目前線程是通過寫base競争失敗（CASE1的條件二），然後進入的if塊，就需要調用fullAddCount方法去擴容或者重試.. 
        // （fullAddCount方法就類似于LongAdder.longAccumulate方法）
        // 條件二：a = as[ThreadLocalRandom.getProbe() & m]) == null 前置條件：cells已經初始化了
        // true->表示目前線程命中的cell表格是個空的，需要目前線程進入fullAddCount方法去初始化cell，放入目前位置.
        // 條件三：!(uncontended = U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x)
        // 前置條件：條件二中目前線程命中的cell表格不是空的~
        //       false->取反得到false，表示目前線程使用cas方式更新目前命中的cell成功
        //       true->取反得到true,表示目前線程使用cas方式更新目前命中的cell失敗，需要進入fullAddCount進行重試或者擴容cells。
        if (as == null || (m = as.length - 1) < 0 ||
            (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
            !(uncontended = U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))
        ) {
            fullAddCount(x, uncontended);
            // 考慮到fullAddCount裡面的事情比較累，就讓目前線程不參與到擴容相關的邏輯了，直接傳回到調用點。
            return;
        }
        
        if (check <= 1)
            return;

        // sumCount統計目前散清單元素個數sum = base + cells[0] + ... + cells[n]，這是一個期望值
        s = sumCount();
    }
    
    // -------------------------判斷是否達到擴容門檻值标準，觸發擴容----------------------------
    // CASE3: 
    // check >= 0表示一定是一個put操作調用的addCount，check < 0是remove操作調用的addCount方法
    if (check >= 0) {
        // tab 表示 map.table
        // nt 表示 map.nextTable
        // n 表示map.table數組的長度
        // sc 表示sizeCtl的臨時值
        Node<K,V>[] tab, nt; int n, sc;

        /**
         * sizeCtl < 0
         * 1. -1 表示目前table正在初始化（有線程在建立table數組），目前線程需要自旋等待..
         * 2.表示目前table數組正在進行擴容 ,高16位表示：擴容的辨別戳   低16位表示：（1 + nThread） 目前參與并發擴容的線程數量
         *
         * sizeCtl = 0，表示建立table數組時 使用DEFAULT_CAPACITY為大小
         *
         * sizeCtl > 0
         *
         * 1. 如果table未初始化，表示初始化大小
         * 2. 如果table已經初始化，表示下次擴容時的 觸發條件（門檻值）
         */

        // 有條件自旋~
        // 條件一：s >= (long)(sc = sizeCtl)
        //        true -> 1.目前sizeCtl為一個負數 表示正在擴容中..
        //                2.目前sizeCtl是一個正數，表示擴容門檻值，但是s已經達到擴容門檻值（需要擴容）
        //        false -> 表示目前table尚未達到擴容門檻值條件（不需要擴容）
        // 條件二：(tab = table) != null 恒成立 true
        // 條件三：(n = tab.length) < MAXIMUM_CAPACITY
        //        true -> 目前table長度小于最大值限制，則可以進行擴容。
        while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
               (n = tab.length) < MAXIMUM_CAPACITY) {

            // 擷取擴容唯一辨別戳
            // eg: 16 -> 32 擴容辨別戳為：1000 0000 0001 1011
            // 什麼意思呢？
            // 即，所有将map容量由16擴容到32的線程，其拿到的擴容唯一辨別戳都是1000 0000 0001 1011
            int rs = resizeStamp(n);
            
            // --------------------------------------------------------------------------
            // CASE4: 
            // 條件成立：表示目前table正在擴容，則，目前線程理論上應該協助table完成擴容
            if (sc < 0) {
                // --------------------------------------------------------------
                // CASE2: 條件1~4隻要有個為true就會跳出循環，不會繼續擴容~
                // 條件一：(sc >>> RESIZE_STAMP_SHIFT) != rs
                //       true -> 說明目前線程擷取到的擴容唯一辨別戳 非 本批次擴容
                //       false -> 說明目前線程擷取到的擴容唯一辨別戳 是 本批次擴容
                // 條件二：JDK1.8 中有bug,jira已經提出來了,其實想表達的是 sc == (rs << 16 ) + 1
                //        true -> 表示擴容完畢，目前線程不需要再參與進來了
                //        false -> 擴容還在進行中，目前線程可以參與
                // 條件三：JDK1.8 中有bug,jira已經提出來了,其實想表達的是:
                // sc == (rs << 16) + MAX_RESIZERS
                //        true-> 表示目前參與并發擴容的線程達到了最大值 65535 - 1
                //        false->表示目前線程可以參與進來
                //條件四：(nt = nextTable) == null
                //        true -> 表示本次擴容結束
                //        false -> 擴容正在進行中
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    // 條件1~4隻要有個為true就會跳出循環，不會繼續擴容~
                    break;

                // --------------------------------------------------------------
                // CASE5: 
                // 前置條件：目前table正在執行擴容中（即，CASE4沒有被通過）目前線程有機會參與進擴容。
                // 條件成立：說明目前線程成功參與到擴容任務中，并且将sc低16位值加1，表示多了一個線程參與工作~
                // 條件失敗：
                // 1.目前有很多線程都在此處嘗試修改sizeCtl，有其它一個線程修改成功了
                // 導緻你的sc期望值與記憶體中的值不一緻，CAS修改失敗。(下次自選大機率不會在來到這裡~)
                // 2.transfer任務内部的線程也修改了sizeCtl。
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    // 擴容（遷移資料）：協助擴容線程，持有nextTable參數，進入該方法協助擴容~
                    transfer(tab, nt);
            }
            // --------------------------------------------------------------------------
            // CASE6: 以CAS的方式去更新sc，更新成功傳回true，否則傳回false
            // 條件成立，說明目前線程是觸發擴容的**第一個**線程，在transfer方法需要做一些擴容準備工作:
            // rs << RESIZE_STAMP_SHIFT：将擴容唯一辨別戳左移16位 eg:
            // 1000 0000 0001 1011 << 16 得到 1000 0000 0001 1011 0000 0000 0000 0000
            // 緊接這 (rs << RESIZE_STAMP_SHIFT) + 2)操作：
            // 1000 0000 0001 1011 0000 0000 0000 0000 + 2 
            // => 1000 0000 0001 1011 0000 0000 0000 0010，這個二進制數有如下含義:
            // sizeCtl的高16位: 1000 0000 0001 1011 表示目前的擴容辨別戳
            // sizeCtl的低16位: 0000 0000 0000 0010 表示(1 + nThread)，即，目前有多少個線程正在參與擴容~
            // 那麼這裡的n是怎麼來的呢？ 
            // eg: (rs << RESIZE_STAMP_SHIFT) + 2 這裡的2，就是1 + 1，後面的1就是對1*Thread，即(1+1*Threads)
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                // 擴容（遷移資料）：觸發擴容條件的線程 不持有nextTable
                transfer(tab, null);
            // 重新計算table中的元素個數
            s = sumCount();
        }
    }
}

（1）元素個數的存儲方式類似于LongAdder類，存儲在不同的段上，減少不同線程同時更新size時的沖突；

（2）計算元素個數時把這些段的值及baseCount相加算出總的元素個數；

（3）正常情況下sizeCtl存儲着擴容門檻，擴容門檻為容量的0.75倍；

（4）擴容時sizeCtl高位存儲擴容郵戳(resizeStamp)，低位存儲擴容線程數加1（1+nThreads）；

（5）其它線程添加元素後如果發現存在擴容，也會加入的擴容行列中來；

以上就是ConcurrentHashMap源碼的put存入資料的方法以及相關方法，由于transfer 遷移資料這個方法比較複雜，我們放在下一篇文章中單獨分析~

ConcurrentHashMap源碼解析_03 put方法源碼分析

1、put方法源碼解析

2、initTable方法源碼分析

繼續閱讀

需求分析-資料流圖

資料庫設計理論及應用（4）——概念結構設計1．概念模型 2．銷售子系統的分E-R圖 3．視圖的內建 4．設計基本E-R圖

資料流圖的設計

資料庫規範化設計理論摘要要

黑馬程式員——C#結構及常用基本類型

試分析如何把數組array中的所有元素循環右移p位

Flash AS3 連續加載外部若幹圖檔

DB2表壓縮功能

華為筆試軟體

項目管理那些事兒

OS --written test1

OS-written test2

壓縮編碼M-JPEG、MPEG4、H.264

轉詳解C#資料庫存取圖檔三大方式

BMP檔案結構及圖像每行位元組計算方法

磁盤結構及在Linux中的命名