天天看點

JVM的重排序

重排序通常是編譯器或運作時環境為了優化程式性能而采取的對指令進行重新排序執行的一種手段。重排序分為兩類:編譯期重排序和運作期重排序,分别對應編譯時和運作時環境。

在并發程式中,程式員會特别關注不同程序或線程之間的資料同步,特别是多個線程同時修改同一變量時,必須采取可靠的同步或其它措施保障資料被正确地修改,這裡的一條重要原則是:不要假設指令執行的順序,你無法預知不同線程之間的指令會以何種順序執行。

編譯期重排序的典型就是通過調整指令順序,在不改變程式語義的前提下,盡可能減少寄存器的讀取、存儲次數,充分複用寄存器的存儲值。

假設第一條指令計算一個值賦給變量a并存放在寄存器中,第二條指令與a無關但需要占用寄存器(假設它将占用a所在的那個寄存器),第三條指令使用a的值且與第二條指令無關。那麼如果按照順序一緻性模型,a在第一條指令執行過後被放入寄存器,在第二條指令執行時a不再存在,第三條指令執行時a重新被讀入寄存器,而這個過程中,a的值沒有發生變化。通常編譯器都會交換第二和第三條指令的位置,這樣第一條指令結束時a存在于寄存器中,接下來可以直接從寄存器中讀取a的值,降低了重複讀取的開銷。

現代cpu幾乎都采用流水線機制加快指令的處理速度,一般來說,一條指令需要若幹個cpu時鐘周期處理,而通過流水線并行執行,可以在同等的時鐘周期内執行若幹條指令,具體做法簡單地說就是把指令分為不同的執行周期,例如讀取、尋址、解析、執行等步驟,并放在不同的元件中處理,同時在執行單元eu中,功能單元被分為不同的元件,例如加法元件、乘法元件、加載元件、存儲元件等,可以進一步實作不同的計算并行執行。

盡管指令在執行時并不一定按照我們所編寫的順序執行,但毋庸置疑的是,在單線程環境下,指令執行的最終效果應當與其在順序執行下的效果一緻,否則這種優化便會失去意義。

通常無論是在編譯期還是運作期進行的指令重排序,都會滿足上面的原則。

在java存儲模型(java memory model, jmm)中,重排序是十分重要的一節,特别是在并發程式設計中。jmm通過happens-before法則保證順序執行語義,如果想要讓執行操作b的線程觀察到執行操作a的線程的結果,那麼a和b就必須滿足happens-before原則,否則,jvm可以對它們進行任意排序以提高程式性能。

volatile關鍵字可以保證變量的可見性,因為對volatile的操作都在main memory中,而main memory是被所有線程所共享的,這裡的代價就是犧牲了性能,無法利用寄存器或cache,因為它們都不是全局的,無法保證可見性,可能産生髒讀。

volatile還有一個作用就是局部阻止重排序的發生,對volatile變量的操作指令都不會被重排序,因為如果重排序,又可能産生可見性問題。

在保證可見性方面,鎖(包括顯式鎖、對象鎖)以及對原子變量的讀寫都可以確定變量的可見性。但是實作方式略有不同,例如同步鎖保證得到鎖時從記憶體裡重新讀入資料重新整理緩存,釋放鎖時将資料寫回記憶體以保資料可見,而volatile變量幹脆都是讀寫記憶體。