众所周知,使用iftop能监控所有程序占用的网络带宽,一般情况下,手动执行iftop就可查看。但现在需要使用脚本来监控程序占用的带宽,遇到的问题真不是一点半点,现记录如下,希望能给其它运维人带来更多的帮助。
中途所遇到的难点:
重定向到文本中的内容,全部是一行,根本无法用脚本取值。最开始我使用python读取这个文件,得到所有特殊符号,找到规律,然后使用sed替换成规范的格式。终于在自己测试机上完成,能展示出正常的格式。当放到线上机器时,特殊符号变了…又变成乱糟糟的了。网上找了很久的资料,终于找到了解决方法:iftop 1.0-pre之后的版本都能输出文本格式,之前用的是iftop 0.7版本。当晚心里有种流泪的感觉,弄了一天,结果有简单现成的方法。。。
原以为程序仅仅监听一个端口进行通信,后来询问研发得知,当这个程序是服务端的时候,端口是固定的;当这个程序主动访问外面的时候,端口是随机的。所以要想监控的准确,必须找到这个程序打开的所有端口。解决方法是:用netstat所这个程序的所有端口找出来。
单位不一样,里面有Mb,Kb,b单位,需要进行换算。我的解决方法是:把Mb替换成*1000,把Kb替换成空,把b直接不要过滤掉。最后用bc一算直接得结果。
根据第2步找到的几个端口,过滤出发送出去的流量一加就可以。但是接收的怎么算?见上边图中第一条流量,有"<="的则为接收流量,"<="这些行都是未知的IP与端口,怎么把它过滤出来得出结果??我的解决方法是:把"=>"行和"<="放两个临时文件中,图中有"=>"的行第一列都有序号,那么全部是"<="行的都和它一一对应,如:发送"=>"中的是序号12,13,15。那么"<="文件中的第12,13,15行就是对应的接收流量。。是不是理解了?
脚本中定义的进程列表为:pragrom_list=(VueDaemonVueCenter VueAgent VueCache VueSERVER VUEConnector Myswitch Slirpvde)
执行脚本的输出单位是Kb。
[root@center230 python]# iftop --help
iftop: unknown option --
iftop: display bandwidth usage on aninterface by host
Synopsis: iftop -h | [-npblNBP] [-iinterface] [-f filter code]
[-F net/mask][-G net6/mask6]
-h display thismessage #帮助信息
-n don‘t do hostname lookups #禁用主机解析,即不会出现IP显示域名
-N don‘t convertport numbers to services #以数字为示端口号,如21端口不会显示成ftp
-p run inpromiscuous mode (show traffic between other
hosts on the samenetwork segment)
-b don‘t displaya bar graph of traffic #以b单位显示
-B Displaybandwidth in bytes #以B单位显示
-iinterface listen on namedinterface #指定监听的网口
-ffilter code use filter code toselect packets to count
(default: none, but onlyIP packets are counted)
-Fnet/mask show traffic flowsin/out of IPv4 network #显示指定Ipv4段流量
-Gnet6/mask6 show traffic flowsin/out of IPv6 network #显示指定Ipv6段流量
-l display andcount link-local IPv6 traffic (default: off) #显示Ipv6的流量
-P show ports aswell as hosts #显示端口信息
-mlimit sets the upper limit forthe bandwidth scale
-cconfig file specifies an alternativeconfiguration file
-t use textinterface without ncurses #使用文本模式输出
Sorting orders:
-o2s Sort by first column(2s traffic average) #按2s平均流量列排序
-o10s Sort by second column(10s traffic average) [default] #按10s平均流量列排序
-o40s Sort by third column(40s traffic average) #按50s平均流量列排序
-osource Sort by source address #按源IP列排序
-odestination Sort by destinationaddress #按目的IP列排序
The following options are only available in combination with -t
-snum print one single textoutput afer num seconds, then quit #指定刷新几次。
-Lnum number of lines to print #显示多少行数据。当程序多流量大时,则要显示行数多些才行。
iftop, version 1.0pre4 #版本信息。
文本输出方法:
iftop -Pp -Nn -t -L 100 -s 1 >temp_file
直接查看输iftop 即可。
iftop详细用法见网上文档。
总结:
1、先尽可能的寻找已有方法。
2、基本功要杂实,对sed,awk,grep等命令要熟练使用。
3、思路要灵活多变,不能被一种方法束缚死。
本文出自 “” 博客,转载请与作者联系!