天天看点

Nagios的简单配置

昨天测试了nagios的安装,今天我进行一些简单的测试实践,来看看昨天nagios是否安装成功。

在服务端,首先我们知道nagios的主配置文件在usr/local/nagios/etc/nagios.cfg,但是,在服务端如果我们需要配置的话,还必须了解另外的一些配置文件,具体如下:

当服务端nagios安装完成时,在/usr/local/nagios/etc/objects目录下还有一些文件模板,用于定义nagios对象。

Localhost.cfg与windows.cfg 新添加监控主机要修改的配置文件linux与windows

Command.cfg 调整监控的命令,可以再在他配置文件中引用

Contacts.cfg调整联系人和联系组信息

Timelates.cfg调整监控时间

Templates.cfg 定义主机服务的一个模板配置文件,可以再在他配置文件中引用

Switch.cfg与printer.cfg 这2个是监控路由器和打印机的模板,默认是没有启用的

成功配置一台nagios监控系统,必须要清楚每个配置文件之间的依赖和被依赖关系,最主要的有4点:

1.定义哪些监控主机,主机组,服务,服务组

2.定义这个监控要用什么命令实现

3.定义监控的时间段

4.定义主机或服务出现问题需要通知的联系人和联系组

<a target="_blank" href="http://blog.51cto.com/attachment/201308/223816517.jpg"></a>

接下来我们在/usr/local/nagios/etc/nagios.cfg文件中,分别找到cfg_file和cfg_dir的关键字段,首先我们要知道cfg_file所读取的是usr/local/nagios/etc/objects中的对象

例如:usr/local/nagios/etc/objects/commands.cfg

而cfg_dir,也就是说可以告诉nagios处理所有配置文件在特定的目录使用cfg_dir指令

例如:cfg_dir=/usr/local/nagios/etc/vmtest

在服务端:

以cfg_dir=/usr/local/nagios/etc/vmtest为例,简单的测试至少需要hosts.cfg、hostgroup.cfg、services.cfg这3个配置文件。

hosts.cfg

define host{

       use                          linux-server

       host_name                test_1.10

       alias                         alca_1.10

       address                    192.168.1.10

       }

hostgroup,cfg

define hostgroup{

       hostgroup_name       test

       members          test_1.10

   }

services.cfg

define service {

       host_name                          test_1.10

       service_description             check_load

       check_command                 check_nrpe!check_load

       max_check_attempts          3

       normal_check_interval        5

       retry_check_interval           1

       check_period                     24x7

       notification_interval           5

       notification_period             24x7

       notification_options           w,u,c,r

       contact_groups                 admins

                   }

       service_description             check_swap

       check_command                 check_nrpe!check_swap

       hostgroup_name                 test

       service_description             check_hda1

       check_command                 check_nrpe!check_hda1

       service_description             check_hda2

       check_command                 check_nrpe!check_hda2

在客户端:

在客户端的nagios中 /usr/local/nagios/etc/nrpe.cfg 配置文件中找到

allowed_host=127.0.0.1,192.168.1.123设置nagios监控服务器的IP地址,也就是我们nagios服务器地址。

其次:设置监控详细参数。也就是需要监控本机的一些服务,并给其设置报警的阀值

-c 代表的就是critical 危险级别 -w 代表是warning 警告级别

在这里我们以上面的swap load和had1、had2为例:

command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20

command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /boot

command[check_hda2]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /

command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%

设置完成后,我们可以通过一条命令来检测下nagios,cfg是否正确,如果正确重启服务进行测试!

/usr/local/nagios/bin/nagios  -v  /usr/local/nagios/etc/nagios.cfg

service nagios restart  ; service xinetd restart;

**************************************************************************************************************

在测试过程中发现检测不到NRPE命令,只需要在command.cfg中写入:

#'check_nrpe‘ command definition

define command{

       command_name check_nrpe

       command_line    $USER1$/check_nrpe   -H   $HOSTADDRESS$   -c   $ARG1$

到此 nagios的安装以及简单配置已经完成,你成功了吗?

本文转自岁月丶倾城博客51CTO博客,原文链接http://blog.51cto.com/alca0126/1285976如需转载请自行联系原作者

laihuadongcto

继续阅读