天天看點

詳細的java(GC)原理

GC的階段 

對每個對象而言,垃圾回收分為兩個階段:finalization和reclamation。 

  • finalization: 指運作這個對象的finalize的方法。
  • reclamation: 回收被這個對象使用的記憶體。

GC的過程的基本步驟 

  • 首先确認對象是不可達的,即将被回收。
  • 其次,如果對象有finalize方法,那麼對象被添加進finalization queue中;然後在某個時間點finalize方法被調用以釋放finalize中的資源。
  • 最後,回收對象占用的記憶體。

關于finalize方法的問題 

  • finalize方法使得GC過程做了更多的事情,增加的GC的負擔。
  • 如果某個對象的finalize方法運作時間過長,它會使得其他對象的finalize方法被延遲執行。
  • finalize方法中如果建立了strong reference引用了其他對象,這會阻止此對象被GC。
  • finalize方法有可能以不可确定的順序執行(也就是說要在安全性要求嚴格的場景中盡量避免使用finalize方法)。
  • 不確定finalize方法會被及時調用,也許程式都退出了,但是finalize方法還沒被調用。

對象引用的類型 

  • Reference(or named Strong Reference):普通類型的引用。
  • SoftReference:被這種引用指向的對象,如果此對象沒要再被其他Strong Reference引用的話,可能在任何時候被GC。雖然是可能在任何時候被GC,但是通常是在可用記憶體數比較低的時候,并且在程式抛出OutOfMemoryError之前才發生對此對象的GC。SoftReference通常被用作實作Cache的對象引用,如果這個對象被GC了,那麼他可以在任何時候再重新被建立。另外,根據JDK文檔中介紹,實際JVM的實作是鼓勵不回收最近建立和最近使用的對象。
  • WeakReference:如果一個被WeakReference引用的對象,當沒要任何SoftReference和StrongReference引用時,立即會被GC。和SoftReference的差別是:WeakReference對象是被eagerly collected,即一旦沒要任何SoftReference和StrongReference引用,立即被清楚;而隻被SoftReference引用的對象,不回立即被清楚,隻有當記憶體不夠,即将發生OutOfMemoryError時才被清除,而且是先清除不常用的。SoftReference适合實作Cache用。
  • PhantomReference(幻影引用):當沒有StrongReference,SoftReference和WeakReference引用時,随時可被GC。通常和ReferenceQueue聯合使用,管理和清除與被引用對象(沒有finalize方法)相關的本地資源。

衡量GC的名額(GC Metrics) 

  • Throughput(吞吐量):所有沒有花在執行GC上的時間占總運作時間的比重。
  • Pauses(暫停):當GC在運作時程式的暫停次數。或者是在感興趣的暫停次數中,暫停的平均時長和最大時長。
  • Footprint(足迹?):目前使用的堆記憶體大小。
  • Promptness(及時性):不再使用的對象多久能被清除掉并釋放其記憶體。

通用GC算法 

Java所使用的所有的GC算法都是通用GC算法概念的變種。 

通用GC算法的假設: 

  • 最近建立的對象很可能很快就不可達了(unreachable,即可被回收了),比如方法内部聲明的本地變量,當程式運作出了本地變量的作用範圍後,本地變量引用的對象就很快不可達了。
  • 一個對象保持可達(reachable)的越久就越不可能被回收。

在Java GC中,對象被劃分為generations(代)或spaces(空間)。Java把對象分為young(年輕代),tenured(年老代)和perm(永久代)。在GC過程中,對象從一個space(空間)移動到另一個space。 

Object Spaces(對象空間) 

  • Young:年輕代中儲存着剛建立的對象,這個代中的對象能夠“minor” or “major” 收集中被回收。
  • Tenured:年老代中儲存着從年輕代中幸存下來的對象,隻能夠在“major”中被回收。
  • Perm:永久代中儲存着JVM所需的對象,比如Class對象和Method對象,以及他們的位元組碼和内部字元串等。對Perm中的對象GC意味着所有的Class都被解除安裝了。

每塊空間的大小由目前的對記憶體大小決定,并且能夠在運作時改變。每個空間之間的關系如下圖所示: 

詳細的java(GC)原理

Young Spaces(年輕空間) 

  • Eden space:存儲自從上次GC完畢之後新建立的對象,除了屬于Perm的對象。當minor collection發生時,Eden space中的對象或者GC清理掉,或者被移到survivor space。
  • Survivor spaces:這個空間中存儲的是自從上次GC幸存下來的young object。在minor GC中,這些對象或者被GC清理掉,或者被移到另外一個survivor空間中。

Minor collections和Major collections 

  • Minor collection當young space被占滿時執行。它比major collections快,因為minor collection僅僅檢查major collection相應的一個子集對象。minor collection比major collection發生的頻率高。
  • Major collection當tenured space被占滿時執行。他會清理tenured和young。

GC運作的三種方式 

在java5和java6中有4中垃圾回收的算法,有一種算法将不再支援,剩餘的三種垃圾回收算法是: serial,  throughput and  concurrent low pause。 

  • Stop the world(停止所有程式的方式):在這種方式運作的GC,在GC完成前,JVM中的所有程式都不允許運作。Serial collector此時做minor和major收集。Throughput collector此時做major collector。
  • Incremental(增量運作方式):目前沒要Java GC算法支援這種運作方式。GC以這種方式運作時,GC允許程式做一小段時間的工作,然後做垃圾回收工作。
  • Concurrent(并行運作):Throughput collector此時做minor collect,Concurrent low pause collector此時做minor和major收集。在這種運作方式下,GC和程式并行的運作,是以程式僅僅被短暫的暫停。

GC算法 

  • Serial算法: 使用-XX:+UseSerialGC開啟此算法的GC。GC使用和應用程式相同的線程去做minor collection和major collection。
  • Throughput:使用-XX:+UseParallelGC開啟此算法GC。GC使用多線程去做minor collection以減少程式停止的時間。但是對于major collection,還是使用同程式相同的線程去做。當具有多核cpu時,并且程式有大量的短生命周期的對象時,并且對程式停頓時間不限制時較好。
  • Concurrent Low Pause: 使用-XX:+UseConcMarkSweepGC開啟此算法GC。使用多線程去做minor和major collection。當具有多核cpu,并且程式有大量的長生命周期的對象,并且對程式停頓時間有限制時,效果較好。

什麼時候發生GC 

GC發生的時刻受堆記憶體大小的影響。如果堆記憶體小,GC會執行的很快,但是又會很快的被填滿,是以GC比頻繁;如果堆記憶體很大,GC會執行的較慢,而且不會很快被填滿,是以執行的比較頻率比較低。 

基本的GC調試 

throughput goal -XX:GCTimeRatio=n: 表示花費總時間百分之多少的CPU時間去運作程式。 

maximum pause time goal -XX:MaxGCPauseMillis=n:每次GC時程式暫停最多多少毫秒。 

footprint goal:如果其他目标都達到了,那麼首先減少heap size,直到前兩個goal不再滿足,然後再慢慢增加。直到滿足前面兩個goal。 

-Xms=n (starting) and -Xmx=n (maximum) heap size,這兩個參數應該都很熟悉,就是JVM使用的最小堆記憶體數和最大堆記憶體數。 

-XX:MinHeapFreeRatio=n, -XX:MaxHeapFreeRatio=n:最小和最大的空閑堆記憶體和被使用堆記憶體的比例。當空閑堆記憶體比例小于MinHeapFreeRatio時,記憶體空間開始擴充。當空閑堆記憶體比例大于MaxHeapFreeRatio時,記憶體空間開始減小。 

-XX:NewSize=n, -XX:MaxNewSize=n:預設的young space的大小(包括eden + survivor 1 + survivor 2)。 

-XX:NewRatio=n:young和tenured的比例。 

-XX:SurvivorRatio=n:每個survivor space 和 eden之間的比例。 

-XX:MaxPermSize=n:perm的最大size。 

-XX:TargetSurvivorRatio=n:每次GC之後幸存下來的空間的目标比例。 

-XX:+DisableExplicitGC:當此參數打開時,在程式中調用System.gc()将會不起作用。預設是off。 

-XX:+ScavengeBeforeFullGC:當打開此參數時,在每次major collection時先執行一次minor collection。預設打開。 

-XX:+UseGCOverheadLimit:當打開此參數時,如果總運作時間的98%的時間都在做GC,則抛出OutOfMemmoryError。預設打開。 

原文連結: http://guibin.iteye.com/blog/1136316