linux删除檔案後沒有釋放空間
今天發現一台伺服器的home空間滿了,于是要清空無用的檔案,當我删除檔案後,發現可用空間沒有變化
os:centos4.7
現象:
發現目前磁盤空間使用情況:
[[email protected] ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 981M 203M 729M 22% /
none 16G 0 16G 0% /dev/shm
/dev/sda9 2.9G 37M 2.7G 2% /tmp
/dev/sda7 4.9G 1.9G 2.7G 42% /usr
/dev/sda8 2.9G 145M 2.6G 6% /var
/dev/mapper/vghome-lvhome
20G 19G 11M 100% /home
/dev/mapper/vgoradata-lvoradata
144G 48G 90G 35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
193G 7.8G 175G 5% /u01/backup
通過下面的指令找到無用的檔案,然後删除
[[email protected] ~]# find /home/oracle/admin/dbticb/udump/ -name "dbticb_*.trc" -mtime +50 | xargs rm -rf
然後在檢視磁盤空間使用情況,發現沒有/home空間沒有變化
[[email protected] ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 981M 203M 729M 22% /
none 16G 0 16G 0% /dev/shm
/dev/sda9 2.9G 37M 2.7G 2% /tmp
/dev/sda7 4.9G 1.9G 2.7G 42% /usr
/dev/sda8 2.9G 145M 2.6G 6% /var
/dev/mapper/vghome-lvhome
20G 19G 11M 100% /home
/dev/mapper/vgoradata-lvoradata
144G 48G 90G 35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
193G 7.8G 175G 5% /u01/backup
這個郁悶啊,明明删除檔案了,怎麼空間沒有被釋放啊,rm指令應該是直接删除啊,在檢視下/home下還有什麼占用空間
[[email protected] ~]# du -h --max-depth=1 /home
16K /home/lost+found
2.6G /home/oracle
2.6G /home
可這裡顯示空間已經釋放了啊,于是google下,
未釋放磁盤空間原因:
在Linux或者Unix系統中,通過rm或者檔案管理器删除檔案将會從檔案系統的目錄結構上解除連結(unlink).然而如果檔案是被
打開的(有一個程序正在使用),那麼程序将仍然可以讀取該檔案,磁盤空間也一直被占用。而我删除的是oracle的告警log檔案
删除的時候檔案應該正在被使用
解決方法
首先獲得一個已經被删除但是仍然被應用程式占用的檔案清單,如下所示:
[[email protected] ~]# lsof |grep deleted
oracle 12639 oracle 5w REG 253,0 648 215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)
oracle 12639 oracle 6w REG 253,0 16749822091 215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle 12639 oracle 7u REG 253,0 0 36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)
oracle 12639 oracle 8w REG 253,0 16749822091 215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle 12641 oracle 5w REG 253,0 648 215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)
oracle 12641 oracle 6w REG 253,0 16749822091 215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
。
。
。
oracle 23492 oracle 6w REG 253,0 16749822091 215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle 23492 oracle 7u REG 253,0 0 36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)
oracle 23492 oracle 8w REG 253,0 16749822091 215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle 23494 oracle 10u REG 253,0 0 36307 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstrmandb (deleted)
從輸出結果可以看到/home/oracle/admin/dbticb/bdump/alert_dbticb.log還被使用,未被釋放空間
如何讓程序釋放呢?
一種方法是kill掉相應的程序,或者停掉使用這個檔案的應用,讓os自動回收磁盤空間
我這個環境有很多程序在使用的這個檔案,停掉程序有點麻煩,再有就是風險很大
當linux打開一個檔案的時候,Linux核心會為每一個程序在/proc/ 『/proc/nnnn/fd/目錄(nnnn為pid)』建立一個以其pid
為名的目錄用來儲存程序的相關資訊,而其子目錄fd儲存的是該程序打開的所有檔案的fd(fd:file descriptor)。
kill程序是通過截斷proc檔案系統中的檔案可以強制要求系統回收配置設定給正在使用的的檔案。
這是一項進階技術,僅到管理者确定不會對運作中的程序造成影響時使用。應用程式對這種方
式支援的并不好,當一個正在使用的檔案被截斷可能會引發不可預知的問題
是以我還是采用停應用來解決
restart oracle資料庫,發現/home/oracle/admin/dbticb/bdump/alert_dbticb.log對應的空間被釋放
在檢視磁盤空間的使用情況,發現空間已經回收了
[[email protected] ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 981M 203M 729M 22% /
none 16G 0 16G 0% /dev/shm
/dev/sda9 2.9G 37M 2.7G 2% /tmp
/dev/sda7 4.9G 1.9G 2.7G 42% /usr
/dev/sda8 2.9G 145M 2.6G 6% /var
/dev/mapper/vghome-lvhome
20G 2.6G 16G 15% /home
/dev/mapper/vgoradata-lvoradata
144G 48G 90G 35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
193G 7.8G 175G 5% /u01/backup
ok,問題解決,然後做下收尾工作即可
學習下lsof指令
lsof全名list opened files,也就是列舉系統中已經被打開的檔案。我們都知道,linux環境中,任何事物都是檔案,
裝置是檔案,目錄是檔案,甚至sockets也是檔案。是以,用好lsof指令,對日常的linux管理非常有幫助。
lsof是linux最常用的指令之一,通常的輸出格式為:
引用
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
常見包括如下幾個字段:更多的可見manual。
1、COMMAND
預設以9個字元長度顯示的指令名稱。可使用+c參數指定顯示的寬度,若+c後跟的參數為零,則顯示指令的全名
2、PID:程序的ID号
3、PPID
父程序的IP号,預設不顯示,當使用-R參數可打開。
4、PGID
程序組的ID編号,預設也不會顯示,當使用-g參數時可打開。
5、USER
指令的執行UID或系統中登陸的使用者名稱。預設顯示為使用者名,當使用-l參數時,可顯示UID。
6、FD
是檔案的File Descriptor number,或者如下的内容:
(這裡很難翻譯對應的意思,保留英文)
引用
cwd current working directory;
Lnn library references (AIX);
jld jail directory (FreeBSD);
ltx shared library text (code and data);
Mxx hex memory-mapped type number xx.
m86 DOS Merge mapped file;
mem memory-mapped file;
mmap memory-mapped device;
pd parent directory;
rtd root directory;
tr kernel trace file (OpenBSD);
txt program text (code and data);
v86 VP/ix mapped file;
檔案的File Descriptor number顯示模式有:
引用
r for read access;
w for write access;
u for read and write access;
N for a Solaris NFS lock of unknown type;
r for read lock on part of the file;
R for a read lock on the entire file;
w for a write lock on part of the file;
W for a write lock on the entire file;
u for a read and write lock of any length;
U for a lock of unknown type;
x for an SCO OpenServer Xenix lock on part of the file;
X for an SCO OpenServer Xenix lock on the entire file;
space if there is no lock.
7、TYPE
引用
IPv4 IPv4的包;
IPv6 使用IPv6格式的包,即使位址是IPv4的,也會顯示為IPv6,而映射到IPv6的位址;
DIR 目錄
LINK 連結檔案
詳情請看manual中更多的注釋。
8、DEVICE
使用character special、block special表示的裝置号
9、SIZE
檔案的大小,如果不能用大小表示的,會留白。使用-s參數控制。
10、NODE
本地檔案的node碼,或者協定,如TCP等
11、NAME
挂載點和檔案的全路徑(連結會被解析為實際路徑),或者連接配接雙方的位址和端口、狀态等
常用示例:
1.顯示開啟檔案/home/oracle/10.2.0/db_1/bin/tnslsnr的程序
[[email protected] ~]# lsof /home/oracle/10.2.0/db_1/bin/tnslsnr
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
tnslsnr 3520 oracle txt REG 253,5 431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr
2.知道22端口現在運作什麼程式
[[email protected] ~]# lsof -i :22
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
sshd 3101 root 3u IPv6 8670 TCP *:ssh (LISTEN)
sshd 4545 root 3u IPv6 4237972 TCP 203.aibo.com:ssh->win-avbmq9e8ka7.gdgg.local:nsjtp-ctrl (ESTABLISHED)
3.顯示init程序現在打開的檔案
[[email protected] ~]# lsof -c init
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
init 1 root cwd DIR 253,0 4096 2 /
init 1 root rtd DIR 253,0 4096 2 /
init 1 root txt REG 253,0 43496 524446 /sbin/init
init 1 root mem REG 253,0 130448 917826 /lib64/ld-2.5.so
init 1 root mem REG 253,0 1678480 917827 /lib64/libc-2.5.so
init 1 root mem REG 253,0 23520 917686 /lib64/libdl-2.5.so
init 1 root mem REG 253,0 247528 917844 /lib64/libsepol.so.1
init 1 root mem REG 253,0 95480 917845 /lib64/libselinux.so.1
init 1 root 10u FIFO 0,16 2311 /dev/initctl
看程序号為1的程序打開了哪些檔案
[[email protected] ~]# lsof -p 1
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
init 1 root cwd DIR 253,0 4096 2 /
init 1 root rtd DIR 253,0 4096 2 /
init 1 root txt REG 253,0 43496 524446 /sbin/init
init 1 root mem REG 253,0 130448 917826 /lib64/ld-2.5.so
init 1 root mem REG 253,0 1678480 917827 /lib64/libc-2.5.so
init 1 root mem REG 253,0 23520 917686 /lib64/libdl-2.5.so
init 1 root mem REG 253,0 247528 917844 /lib64/libsepol.so.1
init 1 root mem REG 253,0 95480 917845 /lib64/libselinux.so.1
init 1 root 10u FIFO 0,16 2311 /dev/initctl
顯示歸屬3520的程序情況
[[email protected] ~]# lsof -g 3520
COMMAND PID PGID USER FD TYPE DEVICE SIZE NODE NAME
tnslsnr 3520 3520 oracle cwd DIR 253,5 4096 11059201 /home/oracle
tnslsnr 3520 3520 oracle rtd DIR 253,0 4096 2 /
tnslsnr 3520 3520 oracle txt REG 253,5 431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr
tnslsnr 3520 3520 oracle mem REG 253,0 130448 917826 /lib64/ld-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,0 1678480 917827 /lib64/libc-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,0 23520 917686 /lib64/libdl-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,0 615136 917834 /lib64/libm-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,0 141208 917829 /lib64/libpthread-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,0 109824 917839 /lib64/libnsl-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,5 20706622 11405436 /home/oracle/10.2.0/db_1/lib/libclntsh.so.10.1
tnslsnr 3520 3520 oracle mem REG 253,5 3803097 11410641 /home/oracle/10.2.0/db_1/lib/libnnz10.so
tnslsnr 3520 3520 oracle mem REG 253,5 83493 11407251 /home/oracle/10.2.0/db_1/lib/libons.so
tnslsnr 3520 3520 oracle mem REG 253,0 53880 917532 /lib64/libnss_files-2.5.so
tnslsnr 3520 3520 oracle mem REG 253,5 8545 11407615 /home/oracle/10.2.0/db_1/lib/libskgxn2.so
tnslsnr 3520 3520 oracle mem REG 253,5 513705 11410332 /home/oracle/10.2.0/db_1/lib/libocrutl10.so
tnslsnr 3520 3520 oracle mem REG 253,5 636161 11410330 /home/oracle/10.2.0/db_1/lib/libocr10.so
tnslsnr 3520 3520 oracle mem REG 253,5 657825 11410331 /home/oracle/10.2.0/db_1/lib/libocrb10.so
tnslsnr 3520 3520 oracle mem REG 253,5 1745769 11410365 /home/oracle/10.2.0/db_1/lib/libhasgen10.so
tnslsnr 3520 3520 oracle mem REG 253,5 61985 11410366 /home/oracle/10.2.0/db_1/lib/libclsra10.so
tnslsnr 3520 3520 oracle 0u CHR 1,3 2553 /dev/null
tnslsnr 3520 3520 oracle 1u CHR 1,3 2553 /dev/null
tnslsnr 3520 3520 oracle 2u CHR 1,3 2553 /dev/null
tnslsnr 3520 3520 oracle 3w REG 253,5 318853012 11633459 /home/oracle/10.2.0/db_1/network/log/listener.log
tnslsnr 3520 3520 oracle 4r FIFO 0,6 15661 pipe
tnslsnr 3520 3520 oracle 5r REG 253,5 11776 11410579 /home/oracle/10.2.0/db_1/network/mesg/nlus.msb
tnslsnr 3520 3520 oracle 6r REG 253,5 46592 11407160 /home/oracle/10.2.0/db_1/network/mesg/tnsus.msb
tnslsnr 3520 3520 oracle 7w FIFO 0,6 15662 pipe
tnslsnr 3520 3520 oracle 8u IPv4 15665 TCP 203.aibo.com:ncube-lm (LISTEN)
tnslsnr 3520 3520 oracle 9u unix 0xffff81021b7d6980 15666 /var/tmp/.oracle/s#3520.1
tnslsnr 3520 3520 oracle 10u unix 0xffff81021b7d66c0 15668 /var/tmp/.oracle/s#3520.2
6.依照檔案夾/home/oracle來搜尋,但不會打開子目錄,用來顯示目錄下被程序開啟的檔案
[[email protected] ~]# lsof +d /home/oracle
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
tnslsnr 3520 oracle cwd DIR 253,5 4096 11059201 /home/oracle
打開/home/oracle檔案夾以及其子目錄搜尋,用來顯示目錄下被程序開啟的檔案
[[email protected] ~]# lsof +D /home/oracle
顯示内容太多了,不顯示了
lsof -i 用以顯示符合條件的程序情況
文法: lsof -i[46] [protocol][@hostname|hostaddr][:service|port]
46 --> IPv4 or IPv6
protocol --> TCP or UDP
hostname --> Internet host name
hostaddr --> IPv4位置
service --> /etc/service中的 service name (可以不隻一個)
port --> 端口号 (可以不隻一個)
例:
[[email protected] ~]# lsof -i [email protected]:1521 -n
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
oracle 15633 oracle 16u IPv4 4069605 TCP 192.168.2.203:31580->192.168.2.245:ncube-lm (ESTABLISHED)
或
[[email protected] ~]# lsof -i [email protected]:1521
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
oracle 15633 oracle 16u IPv4 4069605 TCP 203.aibo.com:31580->192.168.2.245:ncube-lm (ESTABLISHED)
lsof -n 不将IP轉換為hostname,預設是不加上-n參數
顯示某使用者的已經打開的檔案(或該使用者執行程式已經打開的檔案)
[[email protected] ~]# lsof -u oracle
或
[[email protected] ~]# lsof -u 0
僅列印程序,友善shell腳本調用
[[email protected] ~]# lsof -tc sshd
3101
4545
關注:
程序調試指令:truss、strace和ltrace
程序無法啟動,軟體運作速度突然變慢,程式的"SegmentFault"等等都是讓每個Unix系統使用者頭痛的問題,而這些問題都可以通過使用truss、strace和ltrace這三個常用的調試工具來快速診斷軟體的"疑難雜症"。