1、檢視當天有多少個IP通路:
awk '{print $1}' log_file|sort|uniq|wc -l
2、檢視某一個頁面被通路的次數:
grep "/index.php" log_file | wc -l
3、檢視每一個IP通路了多少個頁面:
awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file
4、将每個IP通路的頁面數進行從小到大排序:
awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n
5、檢視某一個IP通路了哪些頁面:
grep ^111.111.111.111 log_file| awk '{print $1,$7}'
6、去掉搜尋引擎統計當天的頁面:
awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l
7、檢視2009年6月21日14時這一個小時内有多少IP通路:
awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq | wc -l
8,檢視apache程序:
ps aux | grep httpd | grep -v grep | wc -l
9,檢視80端口的tcp連接配接:
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
10,通過日志檢視當天ip連接配接數,過濾重複:
cat access_log | grep "20/Oct/2008" | awk '{print $2}' | sort | uniq -c | sort -nr
11,當天ip連接配接數最高的ip都在幹些什麼(原來是蜘蛛):
cat access_log | grep "20/Oct/2008:00" | grep "122.102.7.212" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10
12,當天通路頁面排前10的url:
cat access_log | grep "20/Oct/2008:00" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10
13,用tcpdump嗅探80端口的通路看看誰最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr
接着從日志裡檢視該ip在幹嘛:
cat access_log | grep 122.102.7.212| awk '{print $1"\t"$8}' | sort | uniq -c | sort -nr | less
14,檢視某一時間段的ip連接配接數:
grep "2006:0[7-8]" www20060723.log | awk '{print $2}' | sort | uniq -c| sort -nr | wc -l
本文轉自 亮公子 51CTO部落格,原文連結:http://blog.51cto.com/iyull/1864369