從Java平台的邏輯結構上來看,我們可以從下圖來了解JVM:
從上圖能清晰看到Java平台包含的各個邏輯子產品,也能了解到JDK與JRE的差別
對于JVM自身的實體結構,我們可以從下圖鳥瞰一下:
對于JVM的學習,在我看來這麼幾個部分最重要:
· Java代碼編譯和執行的整個過程
· JVM記憶體管理及垃圾回收機制
下面将這兩個部分進行詳細學習
Java代碼編譯是由Java源碼編譯器完成,流程圖如下所示:
Java位元組碼的執行是由JVM執行引擎來完成,流程圖如下所示:
Java代碼編譯和執行的整個過程包含了一下三個重要的機制:
l Java源碼編譯機制
l 類加載機制
l 類執行機制
Java源碼編譯機制
Java源碼編譯由一下三個過程組成:
l 分析和輸入到符号表
l 注解處理
l 語義分析和生成class檔案
流程圖如下所示:
最後生成的class檔案由一下部分組成:
l 結構資訊。包括class檔案格式版本号及各部分的數量與大小的資訊
l 中繼資料。對應于Java源碼中聲明與常量的資訊。包含類/繼承的超類/實作的接口的聲明資訊、域與方法聲明資訊和常量池。
l 方法資訊。對應Java源碼中語句和表達式對應的資訊。包含位元組碼、異常處理器表、求值棧與局部變量區大小、求值棧的類型記錄、調試符号資訊
類加載機制
JVM的類加載是通過classLoader及其子類來完成的,類的層次關系和加載順序可以由下圖來描述:
1)Bootstrap ClassLoader
負責加載$JAVA_HOME中jre/lib/rt.jar裡所有的class,由C++實作,不是ClassLoader子類
2)Extension ClassLoader
負責加載java平台中擴充功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包
3)App ClassLoader
負責記載classpath中指定的jar包及目錄中class
4)Custom ClassLoader
屬于應用程式根據自身需要自定義的ClassLoader,如tomcat、jboss都會根據j2ee規範自行實作ClassLoader
加載過程中會先檢查類是否被已加載,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,隻要某個classloader已加載就視為已加載此類,保證此類隻所有ClassLoader加載一次。而加載的順序是自頂向下,也就是由上層來逐層嘗試加載此類。
類執行機制
JVM是基于棧的體系結構來執行class位元組碼的。線程建立後,都會産生程式計數器(PC)和棧(Stack),程式計數器存放下一條要執行的指令在方法内的偏移量,棧中存放一個個棧幀,每個棧幀對應着每個方法的每次調用,而棧幀又是有局部變量區和操作數棧兩部分組成,局部變量區用于存放方法中的局部變量和參數,操作數棧中用于存放方法執行過程中産生的中間結果。棧的結構如下圖所示:
JVM記憶體組成結構
JVM棧由堆、棧、本地方法棧、方法區等部分組成,結構圖如下所示:
1)堆
所有通過new建立的對象的記憶體都在堆中配置設定,其大小可以通過-Xmx和-Xms來控制。堆被劃分為新生代和舊生代,新生代又被進一步劃分為Eden和Survivor區,最後Survivor由From Space和To Space組成,結構圖如下所示:
l 新生代。建立的對象都是用新生代配置設定記憶體,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例
l 舊生代。用于存放新生代中經過多次垃圾回收仍然存活的對象
2)棧
每個線程執行每個方法的時候都會在棧中申請一個棧幀,每個棧幀包括局部變量區和操作數棧,用于存放此次方法調用過程中的臨時變量、參數和中間結果
3)本地方法棧
用于支援native方法的執行,存儲了每個native方法調用的狀态
4)方法區
存放了要加載的類資訊、靜态變量、final類型的常量、屬性和方法資訊。JVM用持久代(Permanet Generation)來存放方法區,可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值。
垃圾回收機制
JVM分别對新生代和舊生代采用不同的垃圾回收機制
新生代的GC:
新生代通常存活時間較短,是以基于Copying算法來進行回收,所謂Copying算法就是掃描出存活的對象,并複制到一塊新的完全未使用的空間中,對應于新生代,就是在Eden和From Space或To Space之間copy。新生代采用空閑指針的方式來控制GC觸發,指針保持最後一個配置設定的對象在新生代區間的位置,當有新的對象要配置設定記憶體時,用于檢查空間是否足夠,不夠就觸發GC。當連續配置設定對象時,對象會逐漸從eden到survivor,最後到舊生代,
用java visualVM來檢視,能明顯觀察到新生代滿了後,會把對象轉移到舊生代,然後清空繼續裝載,當舊生代也滿了後,就會報outofmemory的異常,如下圖所示:
在執行機制上JVM提供了串行GC(Serial GC)、并行回收GC(Parallel Scavenge)和并行GC(ParNew)
1)串行GC
在整個掃描和複制過程采用單線程的方式來進行,适用于單CPU、新生代空間較小及對暫停時間要求不是非常高的應用上,是client級别預設的GC方式,可以通過-XX:+UseSerialGC來強制指定
2)并行回收GC
在整個掃描和複制過程采用多線程的方式來進行,适用于多CPU、對暫停時間要求較短的應用上,是server級别預設采用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數
3)并行GC
與舊生代的并發GC配合使用
舊生代的GC:
舊生代與新生代不同,對象存活的時間比較長,比較穩定,是以采用标記(Mark)算法來進行回收,所謂标記就是掃描出存活的對象,然後再進行回收未被标記的對象,回收後對用空出的空間要麼進行合并,要麼标記出來便于下次進行配置設定,總之就是要減少記憶體碎片帶來的效率損耗。在執行機制上JVM提供了串行GC(Serial MSC)、并行GC(parallel MSC)和并發GC(CMS),具體算法細節還有待進一步深入研究。
以上各種GC機制是需要組合使用的,指定方式由下表所示:
指定方式
新生代GC方式
舊生代GC方式
-XX:+UseSerialGC
串行GC
-XX:+UseParallelGC
并行回收GC
并行GC
-XX:+UseConeMarkSweepGC
并發GC
-XX:+UseParNewGC
-XX:+UseParallelOldGC
-XX:+ UseConeMarkSweepGC
不支援的組合
1、-XX:+UseParNewGC -XX:+UseParallelOldGC
2、-XX:+UseParNewGC -XX:+UseSerialGC
首先需要注意的是在對JVM記憶體調優的時候不能隻看作業系統級别Java程序所占用的記憶體,這個數值不能準确的反應堆記憶體的真實占用情況,因為GC過後這個值是不會變化的,是以記憶體調優的時候要更多地使用JDK提供的記憶體檢視工具,比如JConsole和Java VisualVM。
對JVM記憶體的系統級的調優主要的目的是減少GC的頻率和Full GC的次數,過多的GC和Full GC是會占用很多的系統資源(主要是CPU),影響系統的吞吐量。特别要關注Full GC,因為它會對整個堆進行整理,導緻Full GC一般由于以下幾種情況:
· 舊生代空間不足
調優時盡量讓對象在新生代GC時被回收、讓對象在新生代多存活一段時間和不要建立過大的對象及數組避免直接在舊生代建立對象
· Pemanet Generation空間不足
增大Perm Gen空間,避免太多靜态對象
· 統計得到的GC後晉升到舊生代的平均大小大于舊生代剩餘空間
控制好新生代和舊生代的比例
· System.gc()被顯示調用
垃圾回收不要手動觸發,盡量依靠JVM自身的機制
調優手段主要是通過控制堆記憶體的各個部分的比例和GC政策來實作,下面來看看各部分比例不良設定會導緻什麼後果
1)新生代設定過小
一是新生代GC次數非常頻繁,增大系統消耗;二是導緻大對象直接進入舊生代,占據了舊生代剩餘空間,誘發Full GC
2)新生代設定過大
一是新生代設定過大會導緻舊生代過小(堆總量一定),進而誘發Full GC;二是新生代GC耗時大幅度增加
一般說來新生代占整個堆1/3比較合适
3)Survivor設定過小
導緻對象從eden直接到達舊生代,降低了在新生代的存活時間
4)Survivor設定過大
導緻eden過小,增加了GC頻率
另外,通過-XX:MaxTenuringThreshold=n來控制新生代存活時間,盡量讓對象在新生代被回收
由上一篇博文JVM學習筆記(三)------記憶體管理和垃圾回收可知新生代和舊生代都有多種GC政策群組合搭配,選擇這些政策對于我們這些開發人員是個難題,JVM提供兩種較為簡單的GC政策的設定方式
1)吞吐量優先
JVM以吞吐量為名額,自行選擇相應的GC政策及控制新生代與舊生代的大小比例,來達到吞吐量名額。這個值可由-XX:GCTimeRatio=n來設定
2)暫停時間優先
JVM以暫停時間為名額,自行選擇相應的GC政策及控制新生代與舊生代的大小比例,盡量保證每次GC造成的應用停止時間都在指定的數值範圍内完成。這個值可由-XX:MaxGCPauseRatio=n來設定
最後彙總一下JVM常見配置
1 堆設定
o -Xms:初始堆大小
o -Xmx:最大堆大小
o -XX:NewSize=n:設定年輕代大小
o -XX:NewRatio=n:設定年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
o -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5
o -XX:MaxPermSize=n:設定持久代大小
2 收集器設定
o -XX:+UseSerialGC:設定串行收集器
o -XX:+UseParallelGC:設定并行收集器
o -XX:+UseParalledlOldGC:設定并行年老代收集器
o -XX:+UseConcMarkSweepGC:設定并發收集器
3 垃圾回收統計資訊
o -XX:+PrintGC
o -XX:+PrintGCDetails
o -XX:+PrintGCTimeStamps
o -Xloggc:filename
4 并行收集器設定
o -XX:ParallelGCThreads=n:設定并行收集器收集時使用的CPU數。并行收集線程數。
o -XX:MaxGCPauseMillis=n:設定并行收集最大暫停時間
o -XX:GCTimeRatio=n:設定垃圾回收時間占程式運作時間的百分比。公式為1/(1+n)
5 并發收集器設定
o -XX:+CMSIncrementalMode:設定為增量模式。适用于單CPU情況。
o -XX:ParallelGCThreads=n:設定并發收集器年輕代收集方式為并行收集時,使用的CPU數。并行收集線程數。