天天看點

Zabbix監控網絡裝置

近一直在做網絡裝置的監控,包括switch,firewall,netscaler等網絡裝置的流量和性能監控。所有的監控軟體

(nagios,zenoss,zabbix等)監控網絡裝置都是通過SNMP協定進行監控的,提起SNMP協定,大家首先要明白幾個關于SNMP概念:

1)SNMP(Simple Network Management Protocol)簡單網絡管理協定。由一組網絡管理的标準組成,網絡管理者可以通過SNMP協定采集和檢視網絡裝置運作資訊。目前SNMP版本有SNMPv1,SNMPv2和SNMPv3三個版本。

2)SNMP Community:SNMP團體名稱,用于在通路裝置之前認證管理。SNMP Community權限可以設定為隻讀或者讀寫。

    RO(隻讀)表示read-only:隻能讀取裝置的資訊,比如裝置interface,interface traffic等。

    RW(讀寫)表示Read and Write,除了讀取裝置的資訊之外,還能更改裝置的配置資訊。

Router(config)#snmp-server community sfzhang  ro //讀權限

Router(config)#snmp-server community sfzhang  rw //寫權限

3)MIB(Management Information Base):管理資訊庫。MIB是被管理對象的集合。它定義了被管理對象的一系列屬性:對象的名稱、對象的通路權限和對象的資料類型等。

4)OID(ObjectIdentifier):對象标示符。被管理的對象通過OID表示。

    網絡裝置的監控,主要從兩個方面進行監控:

1)網絡裝置的端口流量:比

如說要監控48口的交換機流量,先用類似于getif工具先掃描出交換機每個端口的OID,然後添加48次Incoming流量,在添加48次

Outgoing流量。Zabbix從2.0開始支援自動發現網絡裝置的interface。通過Low-level

discovery可以自動創Items,trigger和graphs,并且可以自動删除不需要的Items。

    下面以netscreen防火牆例來講解:

    首先建立模闆:Configuration->Templates->Create Template建立監控模闆,然後點選Discovery rules建立discovery rule。

Zabbix監控網絡裝置

    Discovery rule的key ifDescr不一定真實存在,但Type的值必須為SNMP agent。

    關于SNMP團體名的定義,可以直接寫團體名稱,或者通過marco方式定義,這樣定義好處是友善别人引用自己的模闆。

Zabbix監控網絡裝置

   通過Low-level

discovery監控網絡裝置的時候會引用兩個macro,一個是SNMPVALUE,一個是SNMPINDEX。可以通過snmpwalk指令檢視到

這兩個變量代表的值,前面的1,2,3和4是SNMPINDEX,後面的mgt,ethernet1/1等是SNMPVALUE,即網絡裝置的

interface。

Zabbix監控網絡裝置

   通過snmpwalk指令檢視網絡裝置所有口的進出口流量。   

Zabbix監控網絡裝置

    知道了SNMPVALU和SNMPINDEX含義和如何通過snmpwalk指令檢視裝置的進出口流量後,很容易定義網絡裝置的進口流量:

Zabbix監控網絡裝置

    定義網絡裝置的出口流量:

Zabbix監控網絡裝置

    建立Graph prototypes,用于展示端口流量圖。

Zabbix監控網絡裝置

2)網絡裝置的性能監控:常見的網絡裝置性能監控主要是記憶體和cpu監控,下面是netscreen常見的OID。

記憶體方面:

剩餘記憶體:1.3.6.1.4.1.3224.16.2.2.0

使用記憶體:1.3.6.1.4.1.3224.16.2.1.0

CPU方面:

cpu平均使用率:1.3.6.1.4.1.3224.16.1.1.0

cpu過去1分鐘使用率:1.3.6.1.4.1.3224.16.1.2.0

cpu過去5分鐘使用率:1.3.6.1.4.1.3224.16.1.3.0

cpu過去15分鐘使用率:1.3.6.1.4.1.3224.16.1.4.0

session會話方面:

nsResSessAllocate:1.3.6.1.4.1.3224.16.3.2.0

nsResSessMaxium:1.3.6.1.4.1.3224.16.3.3.0

nsResSessFailed:1.3.6.1.4.1.3224.16.3.4.0

其它方面的監控:

sysUpTime:1.3.6.1.2.1.1.3.0

3)報警閥值的設定:

流量報警:最近一段時間流量超過多少M報警。

記憶體報警:使用記憶體超過80%報警或者剩餘記憶體少于多少報警。

CPU報警:CPU使用率超過80%報警。

    總結:Zabbix監控網絡裝置的端口流量,無論是防火牆,交換機,路由器,還是存儲,負載均衡裝置都可以按照上面的方法監控流量,至于其它方面的監控可用到官方檢視裝置的OID自己添加Items。

繼續閱讀