天天看點

Linux必學60個指令檔案處理(轉自:CU)

Linux系統資訊存放在檔案裡,檔案與普通的公務檔案類似。每個檔案都有自己的名字、内容、存放位址及其它一些管理資訊,如檔案的使用者、檔案的大小等。檔案可以是一封信、一個通訊錄,或者是程式的源語句、程式的資料,甚至可以包括可執行的程式和其它非正文内容。 Linux檔案系統具有良好的結構,系統提供了很多檔案處理程式。這裡主要介紹常用的檔案處理指令。

file

1.作用

file通過探測檔案内容判斷檔案類型,使用權限是所有使用者。

2.格式

file [options] 檔案名

3.[options]主要參數

-v:在标準輸出後顯示版本資訊,并且退出。

-z:探測壓縮過的檔案類型。

-L:允許符合連接配接。

-f name:從檔案namefile中讀取要分析的檔案名清單。

4.簡單說明

使用file指令可以知道某個檔案究竟是二進制(ELF格式)的可執行檔案, 還是Shell Script檔案,或者是其它的什麼格式。file能識别的檔案類型有目錄、Shell腳本、英文文本、二進制可執行檔案、C語言源檔案、文本檔案、DOS的可執行檔案。

5.應用執行個體

如果我們看到一個沒有字尾的檔案grap,可以使用下面指令:

$ file grap

grap: English text

此時系統顯示這是一個英文文本檔案。需要說明的是,file指令不能探測包括圖形、音頻、視訊等多媒體檔案類型。

mkdir

1.作用

mkdir指令的作用是建立名稱為dirname的子目錄,與MS DOS下的md指令類似,它的使用權限是所有使用者。

2.格式

mkdir [options] 目錄名

3.[options]主要參數

-m, --mode=模式:設定權限<模式>,與chmod類似。

-p, --parents:需要時建立上層目錄;如果目錄早已存在,則不當作錯誤。

-v, --verbose:每次建立新目錄都顯示資訊。

--version:顯示版本資訊後離開。

4.應用執行個體

在進行目錄建立時可以設定目錄的權限,此時使用的參數是“-m”。假設要建立的目錄名是“tsk”,讓所有使用者都有rwx(即讀、寫、執行的權限),那麼可以使用以下指令:

$ mkdir -m 777 tsk

grep

1.作用

grep指令可以指定檔案中搜尋特定的内容,并将含有這些内容的行标準輸出。grep全稱是Global Regular Expression Print,表示全局正規表達式版本,它的使用權限是所有使用者。

2.格式

grep [options]

3.主要參數

[options]主要參數:

-c:隻輸出比對行的計數。

-I:不區分大小寫(隻适用于單字元)。

-h:查詢多檔案時不顯示檔案名。

-l:查詢多檔案時隻輸出包含比對字元的檔案名。

-n:顯示比對行及行号。

-s:不顯示不存在或無比對文本的錯誤資訊。

-v:顯示不包含比對文本的所有行。

pattern正規表達式主要參數:

/:忽略正規表達式中特殊字元的原有含義。

^:比對正規表達式的開始行。

$: 比對正規表達式的結束行。

/<:從比對正規表達式的行開始。

/>:到比對正規表達式的行結束。

[ ]:單個字元,如[A]即A符合要求 。

[ - ]:範圍,如[A-Z],即A、B、C一直到Z都符合要求 。

。:所有的單個字元。

* :有字元,長度可以為0。

正規表達式是Linux/Unix系統中非常重要的概念。正規表達式(也稱為“regex”或“regexp”)是一個可以描述一類字元串的模式(Pattern)。如果一個字元串可以用某個正規表達式來描述,我們就說這個字元和該正規表達式比對(Match)。這和DOS中使用者可以使用通配符“*”代表任意字元類似。在Linux系統上,正規表達式通常被用來查找文本的模式,以及對文本執行“搜尋-替換”操作和其它功能。

4.應用執行個體

查詢DNS服務是日常工作之一,這意味着要維護覆寫不同網絡的大量IP位址。有時IP位址會超過2000個。如果要檢視nnn.nnn網絡位址,但是卻忘了第二部分中的其餘部分,隻知到有兩個句點,例如nnn nn..。要抽取其中所有nnn.nnn IP位址,使用[0-9 ]/{3 /}/.[0-0/{3/}/。含義是任意數字出現3次,後跟句點,接着是任意數字出現3次,後跟句點。

$grep '[0-9 ]/{3 /}/.[0-0/{3/}/' ipfile

補充說明,grep家族還包括fgrep和egrep。fgrep是fix grep,允許查找字元串而不是一個模式;egrep是擴充grep,支援基本及擴充的正規表達式,但不支援/q模式範圍的應用及與之相對應的一些更加規範的模式。

dd

1.作用

dd指令用來複制檔案,并根據參數将資料轉換和格式化。

2.格式

dd [options]

3.[opitions]主要參數

bs=位元組:強迫 ibs=<位元組>及obs=<位元組>。

cbs=位元組:每次轉換指定的<位元組>。

conv=關鍵字:根據以逗号分隔的關鍵字表示的方式來轉換檔案。

count=塊數目:隻複制指定<塊數目>的輸入資料。

ibs=位元組:每次讀取指定的<位元組>。

if=檔案:讀取<檔案>内容,而非标準輸入的資料。

obs=位元組:每次寫入指定的<位元組>。

of=檔案:将資料寫入<檔案>,而不在标準輸出顯示。

seek=塊數目:先略過以obs為機關的指定<塊數目>的輸出資料。

skip=塊數目:先略過以ibs為機關的指定<塊數目>的輸入資料。

4.應用執行個體

dd指令常常用來制作Linux啟動盤。先找一個可引導核心,令它的根裝置指向正确的根分區,然後使用dd指令将其寫入軟碟:

$ rdev vmlinuz /dev/hda

$dd if=vmlinuz of=/dev/fd0

上面代碼說明,使用rdev指令将可引導核心vmlinuz中的根裝置指向/dev/hda,請把“hda”換成自己的根分區,接下來用dd指令将該核心寫入軟碟。

find

1.作用

find指令的作用是在目錄中搜尋檔案,它的使用權限是所有使用者。

2.格式

find [path][options][expression]

path指定目錄路徑,系統從這裡開始沿着目錄樹向下查找檔案。它是一個路徑清單,互相用空格分離,如果不寫path,那麼預設為目前目錄。

3.主要參數

[options]參數:

-depth:使用深度級别的查找過程方式,在某層指定目錄中優先查找檔案内容。

-maxdepth levels:表示至多查找到開始目錄的第level層子目錄。level是一個非負數,如果level是0的話表示僅在目前目錄中查找。

-mindepth levels:表示至少查找到開始目錄的第level層子目錄。

-mount:不在其它檔案系統(如Msdos、Vfat等)的目錄和檔案中查找。

-version:列印版本。

[expression]是比對表達式,是find指令接受的表達式,find指令的所有操作都是針對表達式的。它的參數非常多,這裡隻介紹一些常用的參數。

—name:支援統配符*和?。

-atime n:搜尋在過去n天讀取過的檔案。

-ctime n:搜尋在過去n天修改過的檔案。

-group grpoupname:搜尋所有組為grpoupname的檔案。

-user 使用者名:搜尋所有檔案屬主為使用者名(ID或名稱)的檔案。

-size n:搜尋檔案大小是n個block的檔案。

-print:輸出搜尋結果,并且列印。

4.應用技巧

find指令查找檔案的幾種方法:

(1)根據檔案名查找

例如,我們想要查找一個檔案名是lilo.conf的檔案,可以使用如下指令:

find / -name lilo.conf

find指令後的“/”表示搜尋整個硬碟。

(2)快速查找檔案

根據檔案名查找檔案會遇到一個實際問題,就是要花費相當長的一段時間,特别是大型Linux檔案系統和大容量硬碟檔案放在很深的子目錄中時。如果我們知道了這個檔案存放在某個目錄中,那麼隻要在這個目錄中往下尋找就能節省很多時間。比如smb.conf檔案,從它的檔案字尾“.conf”可以判斷這是一個配置檔案,那麼它應該在/etc目錄内,此時可以使用下面指令:

find /etc -name smb.conf

這樣,使用“快速查找檔案”方式可以縮短時間。

(3)根據部分檔案名查找方法

有時我們知道隻某個檔案包含有abvd這4個字,那麼要查找系統中所有包含有這4個字元的檔案可以輸入下面指令:

find / -name '*abvd*'

輸入這個指令以後,Linux系統會将在/目錄中查找所有的包含有abvd這4個字元的檔案(其中*是通配符),比如abvdrmyz等符合條件的檔案都能顯示出來。

(4) 使用混合查找方式查找檔案

find指令可以使用混合查找的方法,例如,我們想在/etc目錄中查找大于500000位元組,并且在24小時内修改的某個檔案,則可以使用-and (與)把兩個查找參數連結起來組合成一個混合的查找方式。

find /etc -size +500000c -and -mtime +1

mv

1.作用

mv指令用來為檔案或目錄改名,或者将檔案由一個目錄移入另一個目錄中,它的使用權限是所有使用者。該指令如同DOS指令中的ren和move的組合。

2.格式

mv[options] 源檔案或目錄 目标檔案或目錄

3.[options]主要參數

-i:互動方式操作。如果mv操作将導緻對已存在的目标檔案的覆寫,此時系統詢問是否重寫,要求使用者回答“y”或“n”,這樣可以避免誤覆寫檔案。

-f:禁止互動操作。mv操作要覆寫某個已有的目标檔案時不給任何訓示,指定此參數後i參數将不再起作用。

4.應用執行個體

(1)将/usr/cbu中的所有檔案移到目前目錄(用“.”表示)中:

$ mv /usr/cbu/ * .

(2)将檔案cjh.txt重命名為wjz.txt:

$ mv cjh.txt wjz.txt 

ls

1.作用

ls指令用于顯示目錄内容,類似DOS下的dir指令,它的使用權限是所有使用者。

2.格式

ls [options][filename]

3.options主要參數

-a, --all:不隐藏任何以“.” 字元開始的項目。

-A, --almost-all:列出除了“ . ”及 “.. ”以外的任何項目。

--author:印出每個檔案著作者。

-b, --escape:以八進制溢出序清單示不可列印的字元。

--block-size=大小:塊以指定<大小>的位元組為機關。

-B, --ignore-backups:不列出任何以 ~ 字元結束的項目。

-f:不進行排序,-aU參數生效,-lst參數失效。

-F, --classify:加上檔案類型的訓示符号 (*/[email protected]| 其中一個)。

-g:like -l, but do not list owner。

-G, --no-group:inhibit display of group information。

-i, --inode:列出每個檔案的inode号。

-I, --ignore=樣式:不印出任何符合Shell萬用字元<樣式>的項目。

-k:即--block-size=1K。

-l:使用較長格式列出資訊。

-L, --dereference:當顯示符号連結的檔案資訊時,顯示符号連結所訓示的對象,而并非符号連結本身的資訊。

-m:所有項目以逗号分隔,并填滿整行行寬。

-n, --numeric-uid-gid:類似-l,但列出UID及GID号。

-N, --literal:列出未經處理的項目名稱,例如不特别處理控制字元。

-p, --file-type:加上檔案類型的訓示符号 (/[email protected]| 其中一個)。

-Q, --quote-name:将項目名稱括上雙引号。

-r, --reverse:依相反次序排列。

-R, --recursive:同時列出所有子目錄層。

-s, --size:以塊大小為序。

4.應用舉例

ls指令是Linux系統使用頻率最多的指令,它的參數也是Linux指令中最多的。使用ls指令時會有幾種不同的顔色,其中藍色表示是目錄,綠色表示是可執行檔案,紅色表示是壓縮檔案,淺藍色表示是連結檔案,加粗的黑色表示符号連結,灰色表示是其它格式檔案。ls最常使用的是ls- l,見圖1所示。

圖1 使用ls-l指令

檔案類型開頭是由10個字元構成的字元串。其中第一個字元表示檔案類型,它可以是下述類型之一:-(普通檔案)、d(目錄)、l(符号連結)、b(塊裝置檔案)、c(字元裝置檔案)。後面的9個字元表示檔案的通路權限,分為3組,每組3位。第一組表示檔案屬主的權限,第二組表示同組使用者的權限,第三組表示其他使用者的權限。每一組的三個字元分别表示對檔案的讀(r)、寫(w)和執行權限(x)。對于目錄,表示進入權限。s表示當檔案被執行時,把該檔案的UID或GID賦予執行程序的UID(使用者ID)或GID(組 ID)。t表示設定标志位(留在記憶體,不被換出)。如果該檔案是目錄,那麼在該目錄中的檔案隻能被超級使用者、目錄擁有者或檔案屬主删除。如果它是可執行檔案,那麼在該檔案執行後,指向其正文段的指針仍留在記憶體。這樣再次執行它時,系統就能更快地裝入該檔案。接着顯示的是檔案大小、生成時間、檔案或指令名稱。

diff

1.作用

diff指令用于兩個檔案之間的比較,并指出兩者的不同,它的使用權限是所有使用者。

2.格式

diff [options] 源檔案 目标檔案

3.[options]主要參數

-a:将所有檔案當作文本檔案來處理。

-b:忽略空格造成的不同。

-B:忽略空行造成的不同。

-c:使用綱要輸出格式。

-H:利用試探法加速對大檔案的搜尋。

-I:忽略大小寫的變化。

-n --rcs:輸出RCS格式。

cmp

1.作用

cmp(“compare”的縮寫)指令用來簡要指出兩個檔案是否存在差異,它的使用權限是所有使用者。

2.格式

cmp[options] 檔案名

3.[options]主要參數

-l: 将位元組以十進制的方式輸出,并友善将兩個檔案中不同的以八進制的方式輸出。

cat

1.作用

cat(“concatenate”的縮寫)指令用于連接配接并顯示指定的一個和多個檔案的有關資訊,它的使用權限是所有使用者。

2.格式

cat [options] 檔案1 檔案2……

3.[options]主要參數

-n:由第一行開始對所有輸出的行數編号。

-b:和-n相似,隻不過對于空白行不編号。

-s:當遇到有連續兩行以上的空白行時,就代換為一行的空白行。

4.應用舉例

(1)cat指令一個最簡單的用處是顯示文本檔案的内容。例如,我們想在指令行看一下README檔案的内容,可以使用指令:

$ cat README 

(2)有時需要将幾個檔案處理成一個檔案,并将這種處理的結果儲存到一個單獨的輸出檔案。cat指令在其輸入上接受一個或多個檔案,并将它們作為一個單獨的檔案列印到它的輸出。例如,把README和INSTALL的檔案内容加上行号(空白行不加)之後,将内容附加到一個新文本檔案File1 中:

$ cat README INSTALL File1

(3)cat還有一個重要的功能就是可以對行進行編号,見圖2所示。這種功能對于程式文檔的編制,以及法律和科學文檔的編制很友善,列印在左邊的行号使得參考文檔的某一部分變得容易,這些在程式設計、科學研究、業務報告甚至是立法工作中都是非常重要的。

圖2 使用cat指令/etc/named.conf檔案進行編号

對行進行編号功能有-b(隻能對非空白行進行編号)和-n(可以對所有行進行編号)兩個參數:

$ cat -b /etc/named.conf

ln

1.作用

ln指令用來在檔案之間建立連結,它的使用權限是所有使用者。

2.格式

ln [options] 源檔案 [連結名]

3.參數

-f:鍊結時先将源檔案删除。

-d:允許系統管理者硬鍊結自己的目錄。

-s:進行軟鍊結(Symbolic Link)。

-b:将在鍊結時會被覆寫或删除的檔案進行備份。

連結有兩種,一種被稱為硬連結(Hard Link),另一種被稱為符号連結(Symbolic Link)。預設情況下,ln指令産生硬連結。

硬連接配接指通過索引節點來進行的連接配接。在Linux的檔案系統中,儲存在磁盤分區中的檔案不管是什麼類型都給它配置設定一個編号,稱為索引節點号(Inode Index)。在Linux中,多個檔案名指向同一索引節點是存在的。一般這種連接配接就是硬連接配接。硬連接配接的作用是允許一個檔案擁有多個有效路徑名,這樣使用者就可以建立硬連接配接到重要檔案,以防止“誤删”的功能。其原因如上所述,因為對應該目錄的索引節點有一個以上的連接配接。隻删除一個連接配接并不影響索引節點本身和其它的連接配接,隻有當最後一個連接配接被删除後,檔案的資料塊及目錄的連接配接才會被釋放。也就是說,檔案才會被真正删除。

與硬連接配接相對應,Lnux系統中還存在另一種連接配接,稱為符号連接配接(Symbilc Link),也叫軟連接配接。軟連結檔案有點類似于Windows的快捷方式。它實際上是特殊檔案的一種。在符号連接配接中,檔案實際上是一個文本檔案,其中包含的有另一檔案的位置資訊。

動手聯系

上面我們介紹了Linux檔案處理指令,下面介紹幾個執行個體,大家可以動手練習一下剛才講過的指令。

1.利用符号連結快速通路關鍵目錄

符号連結是一個非常實用的功能。假設有一些目錄或檔案需要頻繁使用,但由于Linux的檔案和目錄結構等原因,這個檔案或目錄在很深的子目錄中。比如,Apache Web伺服器文檔位于系統的/usr/local/httpd/htdocs中,并且不想每次都要從主目錄進入這樣一個長的路徑之中(實際上,這個路徑也非常不容易記憶)。

為了解決這個問題,可以在主目錄中建立一個符号連結,這樣在需要進入該目錄時,隻需進入這個連結即可。

為了能友善地進入Web伺服器(/usr/local/httpd/htdocs)文檔所在的目錄,在主目錄下可以使用以下指令:

$ ln -s /usr/local/httpd/htdocs gg

這樣每次進入gg目錄就可通路Web伺服器的文檔,以後如果不再通路Web伺服器的文檔時,删除gg即可,而真正的Web伺服器的文檔并沒有删除。

2.使用dd指令将init.rd格式的root.ram内容導入記憶體

dd if=/dev/fd0 of=floppy.fd

dd if=root.ram of=/dev/ram0 #

3.grep指令系統調用

grep是Linux/Unix中使用最廣泛的指令之一,許多Linux系統内部都可以調用它。

(1)如果要查詢目錄清單中的目錄,方法如下:

$ ls -l | grep '∧d'

(2)如果在一個目錄中查詢不包含目錄的所有檔案,方法如下:

$ ls -l | grep '∧[∧d]'

(3)用find指令調用grep,如所有C源代碼中的“Chinput”,方法如下:

$find /ZhXwin -name *.c -exec grep -q -s Chinput {} /;-print

繼續閱讀