1. nagios安裝 - 服務端
安裝擴充yum源(2個都可以,但是epel-release隻有6.7版本才可以,6.7以前版本不支援)
[root@localhost ~]# yum install -y epel-release
[root@localhost ~]# wget -p /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo
安裝nagios服務以及相關支援服務:
[root@localhost ~]# yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
建立使用者和密碼
[root@localhost ~]# htpasswd -c /etc/nagios/passwd nagiosadmin
檢測配置檔案
[root@localhost ~]# nagios -v /etc/nagios/nagios.cfg
上圖表示 配置正确 沒有問題
啟動服務:
檢測一下:
浏覽器通路: http://ip/nagios
如果沒有得到上面的結果,請檢查selinux和iptables,輸入上面建立的使用者名和密碼
可以看到我安裝的版本是3.5.1。
2. nagios安裝 - 用戶端
安裝nagios用戶端服務
[root@localhost ~]# yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
編輯配置檔案
[root@localhost ~]# vim /etc/nagios/nrpe.cfg
找到“allowed_hosts=127.0.0.1” 改為 “allowed_hosts=192.168.1.201”
allowed_hosts=192.168.1.201 定義伺服器主機
找到” dont_blame_nrpe=0” 改為 “dont_blame_nrpe=1”
dont_blame_nrpe=1
啟動服務
[root@localhost ~]# /etc/init.d/nrpe start
3. 監控中心(192.168.1.201)添加被監控主機(192.168.1.202)
編輯被監控主機配置檔案
[root@localhost ~]# cd /etc/nagios/conf.d/
[root@localhost conf.d]# vim 192.168.1.202.cfg
define host{
use linux-server
host_name 192.168.1.202
alias 1.202
address 192.168.1.202
}
define service{
use generic-service
host_name 192.168.1.202
service_description check_ping
check_command check_ping!100.0,20%!200.0,50%
max_check_attempts 5
normal_check_interval 1
}
service_description check_ssh
check_command check_ssh
max_check_attempts 5
normal_check_interval 1
notification_interval 60
service_description check_http
check_command check_http
max_check_attempts 5
normal_check_interval 1
max_check_attempts 5 ;當nagios檢測到問題時,一共嘗試檢測5次都有問題才會告警,如果該數值為1,那麼檢測到問題立即告警
normal_check_interval 1 ;重新檢測的時間間隔,機關是分鐘,預設是3分鐘
notification_interval 60 ;在服務出現異常後,故障一直沒有解決,nagios再次對使用者發出通知的時間。機關是分鐘。如果你認為,所有的事件隻需要一次通知就夠了,可以把這裡的選項設為0。
檢測配置檔案:
[root@localhost conf.d]# nagios -v /etc/nagios/nagios.cfg
重新開機服務:
去web檢視一下監控情況
4--監控用戶端硬碟,記憶體情況
#由于需要nagios調用的監控指令都需要在command.cfg子產品中定義 而前面的check_nrpe在預設的command.cfg中時沒有的
這裡需要在command.cfg中将其加入進去 現在去伺服器端編輯/objects/commands.cfg
[root@nagios conf.d]# vim /etc/nagios/objects/commands.cfg
define command{
command_name check_nrpe
command_line $user1$/check_nrpe -h $hostaddress$ -c $arg1$
}
定義check_nrpe編輯檔案添加下面内容:
在伺服器端配置被監控端的配置檔案:
[root@localhost conf.d]# cd /etc/nagios/conf.d/
use generic-service
host_name 192.168.1.88
service_description check_load
check_command check_nrpe!check_load
max_check_attempts 5
normal_check_interval 1
service_description check_disk_hda1
check_command check_nrpe!check_hda1
用戶端檢視check_load,check_hda1服務
[root@localhost ~]# df -h
[root@localhost ~]# vi /etc/nagios/nrpe.cfg
檢視一下已經監控到了 ok