天天看點

nagios

1. nagios安裝 - 服務端

安裝擴充yum源(2個都可以,但是epel-release隻有6.7版本才可以,6.7以前版本不支援)

[root@localhost ~]# yum install -y epel-release

nagios

[root@localhost ~]# wget -p /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo

nagios

安裝nagios服務以及相關支援服務:

[root@localhost ~]# yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

nagios

建立使用者和密碼

[root@localhost ~]# htpasswd -c /etc/nagios/passwd nagiosadmin

nagios

檢測配置檔案

[root@localhost ~]# nagios -v /etc/nagios/nagios.cfg

nagios
nagios

上圖表示 配置正确 沒有問題

啟動服務:

nagios

檢測一下:

nagios
nagios

浏覽器通路: http://ip/nagios

nagios

如果沒有得到上面的結果,請檢查selinux和iptables,輸入上面建立的使用者名和密碼

nagios

可以看到我安裝的版本是3.5.1。

2. nagios安裝 - 用戶端

nagios
nagios

安裝nagios用戶端服務

[root@localhost ~]# yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

nagios

編輯配置檔案

[root@localhost ~]# vim /etc/nagios/nrpe.cfg

找到“allowed_hosts=127.0.0.1” 改為 “allowed_hosts=192.168.1.201”

allowed_hosts=192.168.1.201  定義伺服器主機

找到” dont_blame_nrpe=0” 改為  “dont_blame_nrpe=1” 

dont_blame_nrpe=1

nagios

啟動服務

[root@localhost ~]# /etc/init.d/nrpe start

nagios

3. 監控中心(192.168.1.201)添加被監控主機(192.168.1.202)

編輯被監控主機配置檔案

[root@localhost ~]# cd /etc/nagios/conf.d/

[root@localhost conf.d]# vim 192.168.1.202.cfg

define host{

        use                     linux-server            

        host_name           192.168.1.202

        alias                     1.202

        address                 192.168.1.202

        }

define service{

        use                     generic-service

        host_name               192.168.1.202

        service_description     check_ping

        check_command           check_ping!100.0,20%!200.0,50%

        max_check_attempts 5

        normal_check_interval 1

}

        service_description     check_ssh

        check_command           check_ssh

        max_check_attempts      5   

        normal_check_interval    1 

        notification_interval         60 

        service_description     check_http

        check_command           check_http

        max_check_attempts      5

        normal_check_interval    1

   max_check_attempts      5    ;當nagios檢測到問題時,一共嘗試檢測5次都有問題才會告警,如果該數值為1,那麼檢測到問題立即告警

   normal_check_interval    1   ;重新檢測的時間間隔,機關是分鐘,預設是3分鐘

  notification_interval        60  ;在服務出現異常後,故障一直沒有解決,nagios再次對使用者發出通知的時間。機關是分鐘。如果你認為,所有的事件隻需要一次通知就夠了,可以把這裡的選項設為0。 

nagios

檢測配置檔案:

[root@localhost conf.d]# nagios -v /etc/nagios/nagios.cfg

nagios
nagios

重新開機服務:

nagios

去web檢視一下監控情況

nagios
nagios

4--監控用戶端硬碟,記憶體情況

#由于需要nagios調用的監控指令都需要在command.cfg子產品中定義 而前面的check_nrpe在預設的command.cfg中時沒有的 

 這裡需要在command.cfg中将其加入進去 現在去伺服器端編輯/objects/commands.cfg

[root@nagios conf.d]# vim /etc/nagios/objects/commands.cfg

define command{

        command_name    check_nrpe

        command_line    $user1$/check_nrpe -h $hostaddress$ -c $arg1$

        }

定義check_nrpe編輯檔案添加下面内容:

nagios
nagios

在伺服器端配置被監控端的配置檔案:

[root@localhost conf.d]# cd /etc/nagios/conf.d/

        use     generic-service

        host_name       192.168.1.88

        service_description     check_load

        check_command           check_nrpe!check_load

        max_check_attempts 5

        normal_check_interval 1

        service_description     check_disk_hda1

        check_command           check_nrpe!check_hda1

nagios

用戶端檢視check_load,check_hda1服務

[root@localhost ~]# df -h

nagios

[root@localhost ~]# vi /etc/nagios/nrpe.cfg

nagios

檢視一下已經監控到了 ok

nagios