天天看點

Atomic原子類的實作原理

線程安全真的是線程的安全嗎?

什麼是 atomic?

實作一個計數器

atomicinteger 源碼分析

atomiclong 和 longadder 誰更牛?

總結

當我們談論『線程安全』的時候,肯定都會想到 atomic 類。不錯,atomic 相關類都是線程安全的,在講 atomic 類之前我想再聊聊『線程安全』這個概念。

初看『線程安全』這幾個字,很容易望文生義,這不就是線程的安全嗎?其實不是,線程本身沒有好壞,沒有『安全的線程』和『不安全的線程』之分,俗話說:人之初性本善,線程天生也是純潔善良的,真正讓線程變壞是因為通路的變量的原因,變量對于作業系統來說其實就是記憶體塊,是以繞了這麼一大圈,線程安全稱為『記憶體的安全』可能更為貼切。

簡而言之,線程通路的記憶體決定了這個線程是否是安全的。

變量大緻可以分為局部變量和共享變量,局部變量對于 jvm 來說是棧空間,大家都背過八股文,棧是線程私有的是非共享的,那自然也是記憶體安全的;共享變量對于 jvm 來說一般是存在于堆上,堆上的東西是所有線程共享的,如果不加任何限制自然是不安全的。

因為線程安全這個概念已經深入人心了,是以後面我們還是用線程安全來表達記憶體安全的含義。

那如何解決這種​<code>​不安全​</code>​呢?方法有很多,比如:加鎖、atomic 原子類等。

好了,咱們今天先來看看​<code>​atomic類​</code>​。

​<code>​java​</code>​從​<code>​jdk1.5​</code>​開始提供​<code>​java.util.concurrent.atomic​</code>​包,這裡包含了多個原子操作類。原子操作類提供了一個簡單、高效、安全的方式去更新一個變量。

Atomic原子類的實作原理

atomic 包下的原子操作類有很多,可以大緻分為四種類型:

原子操作基本類型

原子操作數組類型

原子操作引用類型

原子操作更新屬性

atomic原子操作類在源碼中都使用了​<code>​unsafe類​</code>​,​<code>​unsafe類​</code>​提供了硬體級别的原子操作,可以安全地直接操作記憶體變量。後面講解源碼時再詳細介紹。

假如在業務代碼中需要實作一個計數器的功能,啪地一下,很快我們就寫出了以下的代碼:

​<code>​increase​</code>​方法對 count 變量進行遞增。

當代碼送出上庫進行​<code>​code review​</code>​時,啪地一下,很快收到了檢視意見(嚴重級别):

如果在多線程場景下,你的計數器可能有問題。

上大一的時候老師就講過 ​<code>​count++​</code>​ 是非原子性的,它實際上包含了三個操作:讀資料,加一,寫回資料。

再次修改代碼,多線通路​<code>​increase方法​</code>​會有問題,那就給它加個鎖吧,count變量修改了其他線程可能不能即時看到,那就給變量加個 ​<code>​volatile​</code>​ 吧。

吭哧吭哧,代碼如下:

一頓操作猛如虎,再次送出代碼後,依然收到了檢視意見(建議級别):

加鎖會影響效率,可以考慮使用原子操作類。

原子操作類?「黑人問号臉」,莫不是大佬知道我晚上有約會故意整我,不想合入代碼吧。帶着将信将疑的态度,打開百度谷歌,原來 atomicinteger 可以輕松解決這個問題,手忙腳亂一頓複制粘貼代碼搞定了,終于可以下班了。

調用​<code>​atomicinteger類​</code>​的​<code>​incrementandget方法​</code>​不用加鎖可以實作安全的遞增,這個好神奇,下面帶領大家分析一下源碼是這麼實作的,等不及了等不及了。

打開源碼,可以看到定義的incrementandget方法:

通過源碼可以看到實際上是調用了 unsafe 的一個方法,unsafe 是什麼待會再說。

我們再看看getandaddint方法的參數:第一個參數 this 是目前對象的引用;第二個參數valueoffset是用來記錄value值在記憶體中的偏移位址,第三個參數是一個常量 1;

在 atomicinteger 中定義了一個常量​<code>​valueoffset​</code>​和一個可變的成員變量 ​<code>​value​</code>​:

​<code>​value​</code>​ 變量儲存目前對象的值,​<code>​valueoffset​</code>​ 是變量的記憶體偏移位址,也是通過調用unsafe的方法擷取。

這裡再說說 ​<code>​unsafe​</code>​ 這個類,人如其名:不安全的類。打開 unsafe 類會看到大部分方法都辨別了 ​<code>​native​</code>​,也就是說這些都是本地方法,本地方法強依賴于作業系統平台,一般都是采用​<code>​c/c++​</code>​語言編寫,在調用 unsafe 類的本地方法實際會執行這些方法,熟悉 c/c++的小夥伴可自行下載下傳源碼研究。

好了,我們再回到最開始,調用了 unsafe 類的getandaddint方法:

通過getintvolatile方法擷取目前 atomicinteger 對象的value值,這是一個本地方法。

然後調用compareandswapint進行 cas 原子操作,嘗試在目前值的基礎上加 1,如果 cas 失敗會循環進行重試。

是以compareandswapint方法是最核心的,詳細實作大家可以自行找源碼看。這裡我們看看方法的參數,一共有四個參數:o 是指目前對象;offset 是指目前對象值的記憶體偏移位址;expected是期望值;x是修改後的值;

compareandswapint方法的思路是拿到對象 o 和 offset 後會再去取對象實際的值,如果目前值與之前取的期望值是一緻的就認為 value 沒有被修改過,直接将 value 的值更新為 x,這樣就完成了一次 cas 操作,cas 操作是通過作業系統保證原子性的。

如果目前值與期望值不一緻,說明 value 值被修改過,那麼就會重試 cas 操作直到成功。

Atomic原子類的實作原理

atomicinteger類中還有很多其他的方法,如:

這些方法實作原理都是大同小異,希望大家可以舉一反三了解其他的方法。

另外還有一些其他的類,如:​<code>​atomiclong​</code>​,​<code>​atomicreference​</code>​,​<code>​atomicintegerarray​</code>​等,這裡也不再贅述,原理都是大同小異。

java 在 ​<code>​jdk1.8版本​</code>​ 引入了 ​<code>​longadder​</code>​ 類,與 ​<code>​atomiclong​</code>​ 一樣可以實作加、減、遞增、遞減等線程安全操作,但是在高并發競争非常激烈的場景下 ​<code>​longadder​</code>​ 的效率更勝一籌,後續單獨用一篇文章進行介紹。

講了半天,可能有的小夥伴還是比較懵,atomic 類到底是如何實作線程安全的?

在語言層面上,atomic 類是沒有做任何同步操作的,翻看源代碼方法沒有任何加鎖,其實最大功勞還是在 cas 身上。cas 利用作業系統的硬體特性實作了原子性,利用 cpu 多核能力實作了硬體層面的阻塞。

隻有 cas 的原子性保證就一定是線程安全的嗎?當然不是的,通過源碼發現 value 變量還用了 volatile 修飾了,保證了線程可見性。

那有些小夥伴可能要問了,那是不是加鎖就沒有用了,非也,雖然基于 cas 的線程安全機制很好很高效,但是這适合一些粒度比較小的需求才有效,如果遇到非常複雜的業務邏輯還是需要加鎖操作的。

大家學會了嗎?

推薦閱讀:

​​世界的真實格局分析,地球人類社會底層運作原理​​

​​不是你需要中台,而是一名合格的架構師(附各大廠中台建設ppt)​​

​​企業it技術架構規劃方案​​

​​論數字化轉型——轉什麼,如何轉?​​

​​華為幹部與人才發展手冊(附ppt)​​

​​企業10大管理流程圖,數字化轉型從業者必備!​​

​​【中台實踐】華為大資料中台架構分享.pdf​​​

​​華為如何實施數字化轉型(附ppt)​​

​​超詳細280頁docker實戰文檔!開放下載下傳​​

​​華為大資料解決方案(ppt)​​

Atomic原子類的實作原理