linux記憶體洩漏程序挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

什麼是記憶體洩漏：

程式向系統申請記憶體，使用完不需要之後,不釋放記憶體還給系統回收，造成申請的記憶體被浪費.

發現系統中記憶體使用量随着時間的流逝，消耗的越來越多，例如下圖所示：

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

接下來的排查思路是:

1.監控系統中每個使用者程序消耗的PSS (使用pmap工具(pmap pid)).

PSS:按比例報告的實體記憶體，比如程序A占用20M實體記憶體，程序B和程序A共享5M實體記憶體，那麼程序A的PSS就是(20 - 5) + 5/2 = 17.5M

2.監控/proc/meminfo輸出,重點觀察Slab使用量和slab對應的/proc/slabinfo資訊

3.參考/proc/meminfo輸出，計算系統中未被統計的記憶體變化，比如核心驅動代碼

直接調用alloc_page()從buddy中拿走的記憶體不會被單獨統計

以上排查思路分别對應下圖中的1,2,3 :

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

在排查的過程中發現系統非常空閑，都沒有跑任何使用者業務程序。

其中在使用slabtop監控slab的使用情況時發現size-4096 不停增長

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

通過監控/proc/slabinfo也發現SReclaimable 的使用量不停增長

while true;dosleep 1 ;cat /proc/slabinfo >> /tmp/slabinfo.txt ;echo "===" >> /tmp/slabinfo.txt ;done

由此判斷很可能是核心空間在使用size-4096 時發生了記憶體洩漏.

接下來使用trace event(tracepoint)功能來監控size-4096的使用和釋放過程，

主要用來跟蹤kmalloc()和kfree()函數對應的trace event, 因為他們的trace event被觸發之後會列印kmalloc()和kfree()所申請和釋放的記憶體位址,然後進一步隻過濾申請4096位元組的情況。

#trace-cmd record -e kmalloc-f 'bytes_alloc==4096' -e kfree -T

(-T 列印堆棧)

等待幾分鐘之後…

#ctrl ^c 中斷trace-cmd

#trace-cmd report

以上步驟相當于：

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

等待幾分鐘之後…

#cp /sys/kernel/debug/tracing/trace_pipe /tmp/kmalloc-trace

從trace-cmd report的輸出結果來看，很多kmalloc 對應的ptr值都沒有kfree與之對應的ptr值

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

這就說明了cat程序在核心空間使用size-4096之後并沒有釋放，造成了記憶體洩漏。

為了進一步精确定位到是使用哪個核心函數造成的問題，此時手動觸發vmcore

#echo c > /proc/sysrq-trigger

然後使用crash工具分析vmcore：

#crash ./vmcore ./vmlinux.debug

讀出上面kmalloc申請的ptr記憶體資訊

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

(讀取0xffff880423744000記憶體開始的4096個位元組，并以字元形式顯示)

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

發現從上面幾個ptr記憶體中讀出的内容都是非常相似，仔細看一下發現都是/proc/schedstat 的輸出内容。

通過閱讀相關代碼發現，當讀出/proc/schedstat内容之後，确實沒有釋放記憶體

linux記憶體洩漏程式挂掉,一次解決Linux核心記憶體洩漏實戰全過程-嵌入式系統-與非網...

然後發現kernel上遊已經有patch解決了這個問題：

commit: 8e0bcc722289

fix a leak in /proc/schedstats