天天看點

輕松精通awk數組企業問題案例

輕松精通awk數組企業問題案例

精彩超詳細解答見

http://edu.51cto.com/course/course_id-4319.html

考試題1:處理以下檔案内容,将域名取出并根據域名進行計數排序處理:(百度和sohu面試題)

oldboy.log

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

考試題2:統計企業工作中高并發web伺服器不同網絡連接配接狀态對應的數量

考試題3.分析圖檔服務日志,把日志(每個圖檔通路次數*圖檔大小的總和)排行,取top10,也就是計算每個url的總通路大小【附加題:加分題】。

所有同學都可以忽略此題答案,學完課程自然就了解了。

說明:本題生産環境應用:這個功能可以用于IDC網站流量帶寬很高,然後通過分析伺服器日志哪些元素占用流量過大,進而進行優化或裁剪該圖檔,壓縮js等措施。

本題需要輸出三個名額: 【通路次數】    【通路次數*單個檔案大小】   【檔案名(可以帶URL)】

測試資料

59.33.26.105 - - [08/Dec/2010:15:43:56 +0800] "GET /static/p_w_picpaths/photos/2.jpg HTTP/1.1" 200 11299 "http://oldboy.blog.51cto.com/static/web/column/17/index.shtml?courseId=43" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)"

59.33.26.105 - - [08/Dec/2010:15:44:02 +0800] "GET /static/flex/vedioLoading.swf HTTP/1.1" 200 3583 "http://oldboy.blog.51cto.com/static/flex/AdobeVideoPlayer.swf?width=590&height=328&url=/`DYNAMIC`/2" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)"

124.115.4.18 - - [08/Dec/2010:15:44:15 +0800] "GET /?= HTTP/1.1" 200 46232 "-" "-"

124.115.4.18 - - [08/Dec/2010:15:44:25 +0800] "GET /static/js/web_js.js HTTP/1.1" 200 4460 "-" "-"

124.115.4.18 - - [08/Dec/2010:15:44:25 +0800] "GET /static/js/jquery.lazyload.js HTTP/1.1" 200 1627 "-" "-"

了解透上述問題并搞定後,你将可以輕松搞定如下擴充的考試題:

擴充考試題1:網友awk問題

4.假如現在有個文本,格式如下:

a  1

b  3

c  2

d  7

b  5

a  3 

g  2

f  6

d  9

即左邊是随機字母,右邊是随機數字,要求寫個腳本使其輸出格式為:

a  4

b  8

d  16

即将相同的字母後面的數字加在一起,按字母的順序輸出。

擴充考試題2:用shell處理以下内容

1、按單詞出現頻率降序排序!

2、按字母出現頻率降序排序!

繼續閱讀