輕松精通awk數組企業問題案例
精彩超詳細解答見
http://edu.51cto.com/course/course_id-4319.html
考試題1:處理以下檔案内容,将域名取出并根據域名進行計數排序處理:(百度和sohu面試題)
oldboy.log
http://www.etiantian.org/index.html
http://www.etiantian.org/1.html
http://post.etiantian.org/index.html
http://mp3.etiantian.org/index.html
http://www.etiantian.org/3.html
http://post.etiantian.org/2.html
考試題2:統計企業工作中高并發web伺服器不同網絡連接配接狀态對應的數量
考試題3.分析圖檔服務日志,把日志(每個圖檔通路次數*圖檔大小的總和)排行,取top10,也就是計算每個url的總通路大小【附加題:加分題】。
所有同學都可以忽略此題答案,學完課程自然就了解了。
說明:本題生産環境應用:這個功能可以用于IDC網站流量帶寬很高,然後通過分析伺服器日志哪些元素占用流量過大,進而進行優化或裁剪該圖檔,壓縮js等措施。
本題需要輸出三個名額: 【通路次數】 【通路次數*單個檔案大小】 【檔案名(可以帶URL)】
測試資料
59.33.26.105 - - [08/Dec/2010:15:43:56 +0800] "GET /static/p_w_picpaths/photos/2.jpg HTTP/1.1" 200 11299 "http://oldboy.blog.51cto.com/static/web/column/17/index.shtml?courseId=43" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)"
59.33.26.105 - - [08/Dec/2010:15:44:02 +0800] "GET /static/flex/vedioLoading.swf HTTP/1.1" 200 3583 "http://oldboy.blog.51cto.com/static/flex/AdobeVideoPlayer.swf?width=590&height=328&url=/`DYNAMIC`/2" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)"
124.115.4.18 - - [08/Dec/2010:15:44:15 +0800] "GET /?= HTTP/1.1" 200 46232 "-" "-"
124.115.4.18 - - [08/Dec/2010:15:44:25 +0800] "GET /static/js/web_js.js HTTP/1.1" 200 4460 "-" "-"
124.115.4.18 - - [08/Dec/2010:15:44:25 +0800] "GET /static/js/jquery.lazyload.js HTTP/1.1" 200 1627 "-" "-"
了解透上述問題并搞定後,你将可以輕松搞定如下擴充的考試題:
擴充考試題1:網友awk問題
4.假如現在有個文本,格式如下:
a 1
b 3
c 2
d 7
b 5
a 3
g 2
f 6
d 9
即左邊是随機字母,右邊是随機數字,要求寫個腳本使其輸出格式為:
a 4
b 8
d 16
即将相同的字母後面的數字加在一起,按字母的順序輸出。
擴充考試題2:用shell處理以下内容
1、按單詞出現頻率降序排序!
2、按字母出現頻率降序排序!