天天看点

zabbix检测网络质量取代smokeping

    趁着中午休息时间写篇博吧。

    最近让我很头疼的一件事就是公司网络的监控,不知道该用什么方案解决,大的网络故障一出现,老总第一时间就问怎么没有监控,这锅真的不好甩。花钱的方案有,但是作为运维人来说不是首选。怎么从开源领域找到一个切实可行的办法呢?

写脚本,全国的节点每个机房抽两台机器跑脚本,管理难度大;

smokeping,搭一台,这是有必要的,但是告警不好聚合与分级,没办法做总的预测;

用zabbix写一个template替代smokeping,看好zabbix告警聚合分级功能;

    zabbix-trapper:这是一种数据传递方式,不同于zabbix-agent,这种方式定义的item需要使用zabbix-sender来发送数据给zabbix-server

(原文:http://wuhf2015.blog.51cto.com/8213008/1766184)

    zabbix-sender需要的参数:

    -z - 指定zabbix server的IP

    -p - 指定zabbix server的端口,默认为10051

    -s - 指定目标主机,主机名必须是配置中的hostname而不是visible name,切记

    -k - 指定key,我们定义的trapper的key,这边便是我们前面定义的trap

    -o - 指定要传递的数据

     使用fping探测各节点丢包率

    fping的参数:

    -b ping包大小

    -c ping的次数   

    -p ping间隔,单位ms

放在server端的externalscripts中的脚本:

脚本赋予执行权限和属主,模板挂载需要探测的节点上,并不需要在每个节点上定义键值对。

模板中的项:

zabbix检测网络质量取代smokeping

模板中的触发值:

zabbix检测网络质量取代smokeping

模板中的图:

zabbix检测网络质量取代smokeping

    以上我们的zabbix形式的smokeping已经建立完成,下面就要用zabbix关联触发与平均值的方式设置主干网的监控了。

    1.每个机房分一个组,在组的基础上设置一个丢包率平均值的it

zabbix检测网络质量取代smokeping

em

    2.设置这个组的警戒点

zabbix检测网络质量取代smokeping

    3.将几个组的警戒点关联在一起,都达到触发要求的时候执行总判断,判断为主干网故障。

zabbix检测网络质量取代smokeping