天天看點

關于多線程程式設計您不知道的 5 件事 有關高性能線程處理的微妙之處

雖然很少有 java™ 開發人員能夠忽視多線程程式設計和支援它的 java 平台庫,更少有人有時間深入研究線程。相反地,我們臨時學習線程,在需要時向我們的工具箱添加新的技巧和技術。以這種方式建構和運作适當的應用程式是可行的,但是您可以做的不止這些。了解 java 編譯器的線程處理特性和 jvm 将有助于您編寫更高效、性能更好的 java 代碼。

<a>1. 同步方法或同步代碼塊?</a>

您可能偶爾會思考是否要同步化這個方法調用,還是隻同步化該方法的線程安全子集。在這些情況下,知道 java 編譯器何時将源代碼轉化為位元組代碼會很有用,它處理同步方法和同步代碼塊的方式完全不同。

當 jvm 執行一個同步方法時,執行中的線程識别該方法的 <code>method_info</code> 結構是否有 <code>acc_synchronized</code> 标記設定,然後它自動擷取對象的鎖,調用方法,最後釋放鎖。如果有異常發生,線程自動釋放鎖。

另一方面,同步化一個方法塊會越過 jvm 對擷取對象鎖和異常處理的内置支援,要求以位元組代碼顯式寫入功能。如果您使用同步方法讀取一個方法的位元組代碼,就會看到有十幾個額外的操作用于管理這個功能。清單 1 展示用于生成同步方法和同步代碼塊的調用:

<a><b>清單 1. 兩種同步化方法</b></a>

<code>synchronizedmethodget()</code> 方法生成以下位元組代碼:

這裡是來自 <code>synchronizedblockget()</code> 方法的位元組代碼:

建立同步代碼塊産生了 16 行的位元組碼,而建立同步方法僅産生了 5 行。

<a href="http://www.ibm.com/developerworks/cn/java/j-5things15/index.html?ca=drs-#ibm-pcon">回頁首</a>

<a>2. threadlocal 變量</a>

如果您想為一個類的所有執行個體維持一個變量的執行個體,将會用到靜态類成員變量。如果您想以線程為機關維持一個變量的執行個體,将會用到線程局部變量。<code>threadlocal</code> 變量與正常變量的不同之處在于,每個線程都有其各自初始化的變量執行個體,這通過 <code>get()</code> 或 <code>set()</code> 方法予以評估。

比方說您在開發一個多線程代碼跟蹤器,其目标是通過您的代碼惟一辨別每個線程的路徑。挑戰在于,您需要跨多個線程協調多個類中的多個方法。如果沒有 <code>threadlocal</code>,這會是一個複雜的問題。當一個線程開始執行時,它需要生成一個惟一的令牌來在跟蹤器中識别它,然後将這個惟一的令牌傳遞給跟蹤中的每個方法。

使用 <code>threadlocal</code>,事情就變得簡單多了。線程在開始執行時初始化線程局部變量,然後通過每個類的每個方法通路它,保證變量将僅為目前執行的線程托管跟蹤資訊。在執行完成之後,線程可以将其特定的蹤迹傳遞給一個負責維護所有跟蹤的管理對象。

當您需要以線程為機關存儲變量執行個體時,使用 <code>threadlocal</code> 很有意義。

<a>3. volatile 變量</a>

我估計,大約有一半的 java 開發人員知道 java 語言包含 <code>volatile</code> 關鍵字。當然,其中隻有 10% 知道它的确切含義,有更少的人知道如何有效使用它。簡言之,使用 <code>volatile</code> 關鍵字識别一個變量,意味着這個變量的值會被不同的線程修改。要完全了解 <code>volatile</code>關鍵字的作用,首先應當了解線程如何處理非易失性變量。

為了提高性能,java 語言規範允許 jre 在引用變量的每個線程中維護該變量的一個本地副本。您可以将變量的這些 “線程局部” 副本看作是與緩存類似,在每次線程需要通路變量的值時幫助它避免檢查主存儲器。

不過看看在下面場景中會發生什麼:兩個線程啟動,第一個線程将變量 a 讀取為 5,第二個線程将變量 a 讀取為 10。如果變量 a 從 5 變為 10,第一個線程将不會知道這個變化,是以會擁有錯誤的變量 a 的值。但是如果将變量 a 标記為 <code>volatile</code>,那麼不管線程何時讀取 a 的值,它都會回頭查閱 a 的原版拷貝并讀取目前值。

如果應用程式中的變量将不發生變化,那麼一個線程局部緩存比較行得通。不然,知道 <code>volatile</code> 關鍵字能為您做什麼會很有幫助。

<a>4. 易失性變量與同步化</a>

如果一個變量被聲明為 <code>volatile</code>,這意味着它預計會由多個線程修改。當然,您會希望 jre 會為易失性變量施加某種形式的同步。幸運的是,jre 在通路易失性變量時确實隐式地提供同步,但是有一條重要提醒:讀取易失性變量是同步的,寫入易失性變量也是同步的,但非原子操作不同步。

這表示下面的代碼不是線程安全的:

上一條語句也可寫成:

換言之,如果一個易失性變量得到更新,這樣其值就會在底層被讀取、修改并配置設定一個新值,結果将是一個在兩個同步操作之間執行的非線程安全操作。然後您可以決定是使用同步化還是依賴于 jre 的支援來自動同步易失性變量。更好的方法取決于您的用例:如果配置設定給易失性變量的值取決于目前值(比如在一個遞增操作期間),要想該操作是線程安全的,那麼您必須使用同步化。

<a>5. 原子字段更新程式</a>

在一個多線程環境中遞增或遞減一個原語類型時,使用在 <code>java.util.concurrent.atomic</code> 包中找到的其中一個新原子類比編寫自己的同步代碼塊要好得多。原子類確定某些操作以線程安全方式被執行,比如遞增和遞減一個值,更新一個值,添加一個值。原子類清單包括 <code>atomicinteger</code>、<code>atomicboolean</code>、<code>atomiclong</code>、<code>atomicintegerarray</code> 等等。

使用原子類的難題在于,所有類操作,包括 <code>get</code>、<code>set</code> 和一系列 <code>get-set</code> 操作是以原子态呈現的。這表示,不修改原子變量值的 <code>read</code>和 <code>write</code> 操作是同步的,不僅僅是重要的 <code>read-update-write</code> 操作。如果您希望對同步代碼的部署進行更多細粒度控制,那麼解決方案就是使用一個原子字段更新程式。

<a>使用原子更新</a>

像 <code>atomicintegerfieldupdater</code>、<code>atomiclongfieldupdater</code> 和 <code>atomicreferencefieldupdater</code> 之類的原子字段更新程式基本上是應用于易失性字段的封裝器。java 類庫在内部使用它們。雖然它們沒有在應用程式代碼中得到廣泛使用,但是也沒有不能使用它們的理由。

清單 2 展示一個有關類的示例,該類使用原子更新來更改某人正在讀取的書目:

<a><b>清單 2. book 類</b></a>

<code>book</code> 類僅是一個 pojo(java 原生類對象),擁有一個單一字段:name。

<a><b>清單 3. myobject 類</b></a>

<a>atomicreferencefieldupdater</a>

<code>atomicreferencefieldupdater</code> 的 javadoc 将其定義為:

對指定類的指定易失性引用字段啟用原子更新的一個基于映像的實用程式。該類旨在用于這樣的一個原子資料結構中:即同一節點的若幹引用字段獨立地得到原子更新。

包含字段的對象的類(在本例中為 <code>myobject</code>)

将得到原子更新的對象的類(在本例中是 <code>book</code>)

将經過原子更新的字段的名稱

這裡真正的價值在于,<code>getwhatimreading</code> 方法未經任何形式的同步便被執行,而 <code>setwhatimreading</code> 是作為一個原子操作執行的。

清單 4 展示如何使用 <code>setwhatimreading()</code> 方法并斷定值的變動是正确的:

<a><b>清單 4. 演習原子更新的測試用例</b></a>

<a>結束語</a>