天天看點

面對枯燥的源碼,如何才能看得下去?

一個軟體開發人員,工作到了一定的年限(一般是3、4年左右),如果他還沒學會閱讀源碼,那麼他就會遇到瓶頸。因為到了這個時候的開發,他應該不僅僅隻會做那些 CURD 的業務邏輯,而應該會根據公司的實際情況去寫架構。而基本上沒有誰能像天才一樣從零寫出一個架構,很多人寫架構其實都是從模仿開始的。而你要模仿,那麼你首先得看得懂架構源碼才行。是以說閱讀源碼才顯得那麼重要。

我在工作一兩年的時候有嘗試去看過 JDK 的源碼,那時候感覺就跟看天書一樣,看一點都覺得痛苦。一直到工作三年左右,因為同僚都在看源碼,我也開始看一些源碼。我看的第一個架構的源碼是 dubbo,雖然說沒有完全搞懂它。但是通過閱讀 dubbo 源碼,我弄懂了 JDK 的 SPI 機制,知道 SPI 在架構開發中的作用。一直到最近閱讀公司的一個網關架構,我才慢慢有一點閱讀源碼的經驗和套路。正好趁熱打鐵,把這些經驗寫下來,希望你們也能早日踏上源碼閱讀之路。

搜尋網上資料

閱讀一個架構的源碼,最基礎的操作肯定是掃一遍網上的各種分析文章。通過這個操作,你可以對這個架構有個大緻的了解。站在巨人的肩膀上,少走許多彎路。但如果你看的項目是公司内部的架構,那麼你隻能找公司内部的文檔了,更甚者,有些連文檔都沒有。那麼你可以略過這一步。

掃一遍源碼

當你拿到架構的源碼的時候,你可以大緻把源碼的每個包,以及每個包下面的檔案掃讀一遍。掃讀并不需要你弄清楚每一行代碼的意思,隻需要讓你知道源碼每一部分的作用。

如果一個開源架構足夠标準,那麼他的命名是非常語義化的。是以我們掃讀的時候,通過包名、檔案名就可以判斷出這個包是用來幹嘛的。例如 util 包是工具類,那我們可以直接跳過。vo 包是存放實體模型的,同樣可以跳過。protocol 包是存放協定相關的等等。通過這麼一個步驟,你會對整個項目有一個基本的印象,知道這個項目大概有哪些東西,哪些相對比較重要。

找到入口

閱讀任何一個架構的源碼,首先就是要找到架構的入口。通過上面掃讀源碼,你應該能夠發現一些入口的迹象,例如對于 Dubbo 來說,你會發現它有一個名為 dubbo-demo 的子子產品,那麼我們肯定重點看它。進一步發掘需求你會發現它的入口就是 dubbo-demo 中的 Provider 類、Consumer 類。我們可以直接接運作這兩個類的 main 方法,并一步步跟蹤代碼的執行情況。

通讀源碼

找到入口之後,下一步就是通讀所有源碼了,就是把源碼的每個檔案每一行都看一遍。在這個階段不求完全弄懂細緻的業務邏輯,但是要形成一個大概的架構,知道這個架構是如何設計的,有哪些大緻的子產品,這些子產品是如何設計的。

在通讀源碼這個階段是最枯燥無味的,也是最容易放棄的。一方面因為源碼實在過于多,另一方面因為沒有一個目标,是以看着看着心裡沒有底,是以容易放棄。我一開始也是如此,但之後我想出了一個比較好的辦法,通過數字化的方式讓自己知道閱讀進度。這樣自己就不會覺得心裡沒底,不知道要多久才能看完了。

我的方法是給我的 IDE 裝一個代碼統計插件:Statistics。這個插件能夠統計項目中的源碼行數。例如下面是我統計 dubbo 項目源碼的截圖,它會列出每個 java 檔案的源碼行數,以及總共的行數。

從上面的截圖我們可以看到 dubbo 項目裡,源碼的行數有 11 萬行。這樣一來,自己心理也有個大緻的預期了。接下來,我會把這些資料拷貝出來,放在一個 Excel 表格裡,就像下面這樣子:

在 Excel 表格中,我隻會存放每個源碼檔案的名字、其源碼行數、源碼行數占比。接下來我會按着入口,一個個去看源檔案,把每個方法看過一遍,看過的方法我會寫一個注釋,例如:csy mark,并寫上我的注釋。當我把一個檔案都看過之後,我會把 Excel 表格中對應的檔案最右邊一列,寫上其百分比。最後我會在下邊有一行,統計我所看完檔案的百分比。

我每看完一個方法,我就寫一個 csy done 來鼓勵下自己。每看完一個檔案,我就在 Excel 中把它标記為完成,最下邊的已讀百分比也會跟着不斷升高。通過這種方式,我讓枯燥無味的源碼閱讀,有些一點趣味,有了一些目标。

通讀源碼是最枯燥的,最容易沒有方向和目标的。有了數字化的記錄,你可以知道自己現在的進度是怎麼樣,看了多少的源碼。很多時候我們看了很久,發覺沒什麼進度的樣子,又不想看了。這時候你可以給自己定一個目标,例如:一天看完 5% 的源碼就可以休息。那當你想偷懶的時候,看看 Excel 下方的已讀百分比,還沒到 5%,繼續看吧。

這種方式對于我來說,還是有一定作用的。但對于你們不知道有沒有作用,你們可以嘗試一下。如果有用的話,就來評論告訴我吧。

梳理架構

在通讀源碼的過程中,你就會對架構有許多新的認識,會知道這個架構大緻分為哪幾個部分,每個部分的作用是什麼,這個子產品用了什麼設計理念等等。

如果說上個階段是通讀源碼,那麼這個階段就是要把你在通讀源碼過程中的收獲整理出來。在整理的過程中,你肯定會有更多的疑問,你會不斷地細化,不斷地精讀。

批判性思考

通過了上面幾個階段,你會發現你對這個架構有了整體的認識,并且對每個子產品的實作細節都有了比較深刻的認識。這個時候,你可以想一想為什麼它要這麼做,這麼做有什麼好處,那能用另一種方式做得更好嗎?

總結

上面幾個階段是我閱讀幾個架構源碼之後的一些體會,相信會是一個不錯的源碼閱讀指南。如果你有更好的源碼閱讀經驗或方法,歡迎留言與我交流