有沒有這樣一種感受,自己寫的代碼在開發、測試環境跑的穩得一筆,可一到線上就抽風,不是缺這個就是少那個反正就是一頓報錯,線上調試代碼又很麻煩,讓人頭疼得很。阿裡巴巴出了一款名叫 Arthas
的工具,可以線上分析診斷Java代碼,着實讓人眼前一亮。
一、Arthas 是什麼?
Arthas(阿爾薩斯)
是阿裡開源的一個Java線上分析診斷工具
二、Arthas 能解決啥問題?
在日常開發上線過程中,我們多多少少都會遇到下邊這些問題,苦于無法線上調試,隻能通過老鳥的經驗來硬分析bug,效率上不去還總開口問别人答疑解惑,多少有些不好意思。
- 這個類從哪個 jar 包加載的?為什麼會報各種類相關的 Exception?
- 我改的代碼為什麼沒有執行到?難道是我沒 commit?分支搞錯了?
- 遇到問題無法線上上 debug,難道隻能通過加日志再重新釋出嗎?
- 線上遇到某個使用者的資料處理有問題,但線上同樣無法 debug,線下無法重制!
- 是否有一個全局視角來檢視系統的運作狀況?
- 有什麼辦法可以監控到JVM的實時運作狀态?
- 線上代碼有錯誤,不想重新釋出?那能不能改class檔案替換一下?
三、Arthas兩種安裝、啟動方式
1、jar包啟動
wget https://alibaba.github.io/arthas/arthas-boot.jar
java -jar arthas-boot.jar --target-ip 0.0.0.0
首先想用
arthas
調試項目,伺服器必須要有運作着的Java服務,
demo-0.0.1-SNAPSHOT.jar
就是我啟動的測試項目,啟動
arthas
後它會自動檢測本地所有的Java服務列出來,我們隻需按照序号輸入想要調試的項目即可,選
1
進入對應程序的
arthas
互動平台
[root@iz2zehzeir87zi8q99krk1z data]# java -jar arthas-boot.jar --target-ip 172.17.72.201
[INFO] arthas-boot version: 3.1.0
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 28679 demo-0.0.1-SNAPSHOT.jar
2、線上安裝
curl -L https://alibaba.github.io/arthas/install.sh | sh
執行上面的指令會在所在的檔案中生成as.sh執行檔案
啟動arthas
./as.sh PID #程序id 指定JAVA程序id
./as.sh -h #h來擷取更多參數資訊
3、遠端連接配接:
要想使用arthas服務的 web console必須對外暴露本機ip
java -jar arthas-boot.jar --target-ip 172.17.72.201
java -jar arthas-boot.jar --telnet-port 9999 --http-port -1
./as.sh --target-ip 0.0.0.0
./as.sh --telnet-port 9999 --http-port -1
通路
arthas
控制台也有兩種方法
(1)、web console 界面
重點說明:-
-target-ip
的
ip
一定要是
arthas
所在機器對外暴露的ip,但如果用的是阿裡雲機器必須要使用私有ip啟動arthas服務,但通路必須是公網IP
(2)、telnet方式
telnet 10.0.2.5 8563
http://59.110.218.9:8563/ ,進入互動平台
四、Arthas 指令使用
1、Dashboard 指令
檢視目前系統的實時資料面闆,例如:伺服器thread資訊、記憶體memory、GC回收等情況
2、Thread(線程監控)
$ thread -n 3
"as-command-execute-daemon" Id=57 cpuUsage=72% RUNNABLE
at sun.management.ThreadImpl.dumpThreads0(Native Method)
at sun.management.ThreadImpl.getThreadInfo(ThreadImpl.java:448)
at com.taobao.arthas.core.command.monitor200.ThreadCommand.processTopBusyThreads(ThreadCommand.java:133)
at com.taobao.arthas.core.command.monitor200.ThreadCommand.process(ThreadCommand.java:79)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.process(AnnotatedCommandImpl.java:82)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.access$100(AnnotatedCommandImpl.java:18)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:111)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:108)
at com.taobao.arthas.core.shell.system.impl.ProcessImpl$CommandProcessTask.run(ProcessImpl.java:370)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Number of locked synchronizers = 1
- java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7
可以看到這個線程是被
synchroned
關鍵字鎖導緻的阻塞 ,目前隻支援找出
synchronized
關鍵字阻塞住的線程, 如果是
java.util.concurrent.Lock
, 目前還不支援。
Number of locked synchronizers = 1
- java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7
thread -n 3 #目前最忙的前N個線程
thread -b, ##找出目前阻塞其他線程的線程
thread -n 3 -i 1000 #間隔一定時間後展示
重點學習:
thread -b
, ##找出目前阻塞其他線程的線程
3、JVM (jvm實時運作狀态,記憶體使用情況等)
$ jvm
RUNTIME
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
MACHINE-NAME 28679@iz2zehzeir87zi8q99krk1z
JVM-START-TIME 2019-03-28 17:32:16
MANAGEMENT-SPEC-VERSION 1.2
SPEC-NAME Java Virtual Machine Specification
SPEC-VENDOR Oracle Corporation
SPEC-VERSION 1.8
VM-NAME Java HotSpot(TM) 64-Bit Server VM
VM-VENDOR Oracle Corporation
VM-VERSION 25.191-b12
INPUT-ARGUMENTS []
CLASS-PATH demo-0.0.1-SNAPSHOT.jar
BOOT-CLASS-PATH /usr/local/jdk/jre/lib/resources.jar:/usr/local/jdk/jre/lib/rt.jar:/usr/local/jdk/jre/lib/sunrsasign.jar:/usr/local/jdk/jre/lib/jsse.jar:/usr/local/jdk/jre/lib/jce.jar
:/usr/local/jdk/jre/lib/charsets.jar:/usr/local/jdk/jre/lib/jfr.jar:/usr/local/jdk/jre/classes
LIBRARY-PATH /usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib
4、trace (目前方法内部調用路徑,路徑上每個節點的耗時)
$ trace #類名 #方法名
對于執行耗時相對較長的方法,調用鍊路耗時屬性會高亮顯示友善排查
參數
-j
可以過濾jdk的函數
trace -j com.example.demo.controller index2
#cost
可以按執行耗時毫秒ms過濾
trace -j com.example.demo.controller index2 ’#cost >10‘
5、watch
目前方法執行資料觀測,能觀察到的範圍為:傳回值、抛出異常、入參
$ trace #類名 #方法名 "{params,target,returnObj,throwExp }"
OGNL 表達式 {params,target,returnObj,throwExp }
throwExp
:異常
params
:入參(數組),單個參數params【0】
returnObj
:傳回值
$ watch com.example.demo.controller index2 "{params,target,returnObj}" -x 5
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 81 ms.
ts=2019-03-29 14:24:14; [cost=1000.746582ms] result=@ArrayList[
@Object[][
@String[辛志富],
],
@controller[
],
@String[index2],
]
6、stack
目前方法被調用的路徑,顯示目前方法被那些方法調用
public static String uuidOne() {
return uuidTwo();
}
public static String uuidTwo() {
return UUID.randomUUID().toString().replaceAll("-", "");
}
$ stack com.example.demo.controller uuidTwo
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 58 ms.
ts=2019-03-29 14:38:19;thread_name=http-nio-8888-exec-5;id=13;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@525b461a
@com.example.demo.controller.uuidOne()
at com.example.demo.controller.index2(controller.java:31)
at sun.reflect.GeneratedMethodAccessor36.invoke(null:-1)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
7、monitor 指令
監控類、方法的調用進行監控,調用次數、成功次數、失敗次數、平均響應時長、失敗率等
$ monitor -c 4 com.example.demo.controller uuidTwo
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 56 ms.
timestamp class method total success fail avg-rt(ms) fail-rate
--------------------------------------------------------------------------------------------------------
2019-03-29 14:55:40 com.example.demo.controller uuidTwo 7 7 0 0.18 0.00%
8、classloader 指令
将JVM中所有的類加載器統計出來,樹狀展示
$ classloader #每種classloader加載類的個樹
name numberOfInstances loadedCountTotal
org.springframework.boot.loader.LaunchedURLClassLoader 1 4463
com.taobao.arthas.agent.ArthasClassloader 2 3631
BootstrapClassLoader 1 2961
java.net.FactoryURLClassLoader 1 835
sun.misc.Launcher$AppClassLoader 1 46
sun.reflect.DelegatingClassLoader 41 41
sun.misc.Launcher$ExtClassLoader 1 25
Affect(row-cnt:7) cost in 7 ms.
$ classloader -t # 類加載器間的層級關系
+-BootstrapClassLoader
+-sun.misc.Launcher$ExtClassLoader@1959f618
+-com.taobao.arthas.agent.ArthasClassloader@5fc476c6
+-com.taobao.arthas.agent.ArthasClassloader@5017e14b
+-sun.misc.Launcher$AppClassLoader@5c647e05
+-java.net.FactoryURLClassLoader@4ad317f0
+-org.springframework.boot.loader.LaunchedURLClassLoader@20ad9418
Affect(row-cnt:7) cost in 5 ms
五、線上代碼熱更新(動态修改上線項目代碼)
手動在代碼中抛異常,不停機不重新發包的情況下,修改線上代碼
啟動服務也達到我們預期異常
替換代碼的流程:
1、 jad指令
将需要更改的檔案先進行反編譯,儲存下來 ,編譯器修改
jad指令
$ jad --source--only com.example.demo.DemoApplication > /data/DemoApplication.java
修改完以後需要将類重新加載到JVM
2、 SC指令
查找目前類是哪個classLoader加載的
SC指令
$ sc -d *DemoApplication | grep classLoader
classLoaderHash 20ad9418 #類加載器 編号
3、 MC指令
用指定的classloader重新将類在記憶體中編譯
MC指令
$ mc -c 20ad9418 /data/DemoApplication.java -d /data
Memory compiler output:
/data/com/example/demo/DemoApplication.class
4、 redefine指令
将編譯後的類加載到JVM
redefine指令
上邊編譯後的.class檔案位址
$ redefine /data/com/example/demo/DemoApplication.class
redefine success, size: 1
檔案替換後我們再次通路一下程式,發現異常沒有了程式已經是我們修改正确後的,class檔案替換成功
這樣我們就用
arthas
現實了不停機、不發包替換了生産環境的Java代碼,功能确實比較強大,本文隻揭開了
arthas
強大功能的冰山一角,後續将出更詳細的文章,友善大家一起學習
小福利:
有一些付費課程 ,噓~,免費 送給小夥伴們。關注我的公号【程式員内點事】,回複【666】,無套路自行領取哦