天天看點

inode 軟/硬連結

一、inode是什麼?

了解inode,要從檔案儲存說起。

檔案儲存在硬碟上,硬碟的最小存儲機關叫做"扇區"(Sector)。每個扇區儲存512位元組(相當于0.5KB)。

作業系統讀取硬碟的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是檔案存取的最小機關。"塊"的大小,最常見的是4KB,即連續八個 sector組成一個 block。

檔案資料都儲存在"塊"中,那麼很顯然,我們還必須找到一個地方儲存檔案的元資訊,比如檔案的建立者、檔案的建立日期、檔案的大小等等。這種儲存檔案元資訊的區域就叫做inode,中文譯名為"索引節點"。

二、inode的内容

inode包含檔案的元資訊,具體來說有以下内容:

  * 檔案的位元組數

  * 檔案擁有者的User ID

  * 檔案的Group ID

  * 檔案的讀、寫、執行權限

  * 檔案的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指檔案内容上一次變動的時間,atime指檔案上一次打開的時間。

  * 連結數,即有多少檔案名指向這個inode

  * 檔案資料block的位置

可以用stat指令,檢視某個檔案的inode資訊:

stat example.txt

總之,除了檔案名以外的所有檔案資訊,都存在inode之中。至于為什麼沒有檔案名,下文會有詳細解釋。

三、inode的大小

inode也會消耗硬碟空間,是以硬碟格式化的時候,作業系統自動将硬碟分成兩個區域。一個是資料區,存放檔案資料;另一個是inode區(inode table),存放inode所包含的資訊。

每個inode節點的大小,一般是128位元組或256位元組。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設定一個inode。假定在一塊1GB的硬碟中,每個inode節點的大小為128位元組,每1KB就設定一個inode,那麼inode table的大小就會達到128MB,占整塊硬碟的12.8%。

檢視每個硬碟分區的inode總數和已經使用的數量,可以使用df指令。

df -i

檢視每個inode節點的大小,可以用如下指令:

sudo dumpe2fs -h /dev/hda | grep "Inode size"

由于每個檔案都必須有一個inode,是以有可能發生inode已經用光,但是硬碟還未存滿的情況。這時,就無法在硬碟上建立新檔案。

四、inode号碼

每個inode都有一個号碼,作業系統用inode号碼來識别不同的檔案。

這裡值得重複一遍,Unix/Linux系統内部不使用檔案名,而使用inode号碼來識别檔案。對于系統來說,檔案名隻是inode号碼便于識别的别稱或者綽号。表面上,使用者通過檔案名,打開檔案。實際上,系統内部這個過程分成三步:首先,系統找到這個檔案名對應的inode号碼;其次,通過inode号碼,擷取inode資訊;最後,根據inode資訊,找到檔案資料所在的block,讀出資料。

使用ls -i指令,可以看到檔案名對應的inode号碼:

ls -i example.txt

五、目錄檔案

Unix/Linux系統中,目錄(directory)也是一種檔案。打開目錄,實際上就是打開目錄檔案。

目錄檔案的結構非常簡單,就是一系列目錄項(dirent)的清單。每個目錄項,由兩部分組成:所包含檔案的檔案名,以及該檔案名對應的inode号碼。

ls指令隻列出目錄檔案中的所有檔案名:

ls /etc

ls -i指令列出整個目錄檔案,即檔案名和inode号碼:

ls -i /etc

如果要檢視檔案的詳細資訊,就必須根據inode号碼,通路inode節點,讀取資訊。ls -l指令列出檔案的詳細資訊。

ls -l /etc

六、硬連結

一般情況下,檔案名和inode号碼是"一一對應"關系,每個inode号碼對應一個檔案名。但是,Unix/Linux系統允許,多個檔案名指向同一個inode号碼。這意味着,可以用不同的檔案名通路同樣的内容;對檔案内容進行修改,會影響到所有檔案名;但是,删除一個檔案名,不影響另一個檔案名的通路。這種情況就被稱為"硬連結"(hard link)。

ln指令可以建立硬連結:

ln 源檔案 目标檔案

運作上面這條指令以後,源檔案與目标檔案的inode号碼相同,都指向同一個inode。inode資訊中有一項叫做"連結數",記錄指向該inode的檔案名總數,這時就會增加1。反過來,删除一個檔案名,就會使得inode節點中的"連結數"減1。當這個值減到0,表明沒有檔案名指向這個inode,系統就會回收這個inode号碼,以及其所對應block區域。

這裡順便說一下目錄檔案的"連結數"。建立目錄時,預設會生成兩個目錄項:"."和".."。前者的inode号碼就是目前目錄的inode号碼,等同于目前目錄的"硬連結";後者的inode号碼就是目前目錄的父目錄的inode号碼,等同于父目錄的"硬連結"。是以,任何一個目錄的"硬連結"總數,總是等于2加上它的子目錄總數(含隐藏目錄),這裡的2是父目錄對其的“硬連結”和目前目錄下的".硬連結“。

七、軟連結

除了硬連結以外,還有一種特殊情況。檔案A和檔案B的inode号碼雖然不一樣,但是檔案A的内容是檔案B的路徑。讀取檔案A時,系統會自動将通路者導向檔案B。是以,無論打開哪一個檔案,最終讀取的都是檔案B。這時,檔案A就稱為檔案B的"軟連結"(soft link)或者"符号連結(symbolic link)。

這意味着,檔案A依賴于檔案B而存在,如果删除了檔案B,打開檔案A就會報錯:"No such file or directory"。這是軟連結與硬連結最大的不同:檔案A指向檔案B的檔案名,而不是檔案B的inode号碼,檔案B的inode"連結數"不會是以發生變化。

ln -s指令可以建立軟連結。

ln -s 源文檔案或目錄 目标檔案或目錄

八、inode的特殊作用

由于inode号碼與檔案名分離,這種機制導緻了一些Unix/Linux系統特有的現象。

  1. 有時,檔案名包含特殊字元,無法正常删除。這時,直接删除inode節點,就能起到删除檔案的作用。

  2. 移動檔案或重命名檔案,隻是改變檔案名,不影響inode号碼。

  3. 打開一個檔案以後,系統就以inode号碼來識别這個檔案,不再考慮檔案名。是以,通常來說,系統無法從inode号碼得知檔案名。

      第3點使得軟體更新變得簡單,可以在不關閉軟體的情況下進行更新,不需要重新開機。因為系統通過inode号碼,識别運作中的檔案,不通過檔案名。更新的時候,新版檔案以同樣的檔案名,生成一個新的inode,不會影響到運作中的檔案。等到下一次運作這個軟體的時候,檔案名就自動指向新版檔案,舊版檔案的inode則被回收。

九 實際問題

在一台配置較低的Linux伺服器(記憶體、硬碟比較小)的/data分區内建立檔案時,系統提示磁盤空間不足,用df -h指令檢視了一下磁盤使用情況,發現/data分區隻使用了66%,還有12G的剩餘空間,按理說不會出現這種問題。 後來用df -i檢視了一下/data分區的索引節點(inode),發現已經用滿(IUsed=100%),導緻系統無法建立新目錄和檔案。 

查找原因:

  /data/cache目錄中存在數量非常多的小位元組緩存檔案,占用的Block不多,但是占用了大量的inode。 

解決方案:

  1、删除/data/cache目錄中的部分檔案,釋放出/data分區的一部分inode。

  2、用軟連接配接将空閑分區/opt中的newcache目錄連接配接到/data/cache,使用/opt分區的inode來緩解/data分區inode不足的問題:

  ln -s /opt/newcache /data/cache 

                                                 -