天天看点

用SHELL脚本自动化安装Nagios服务器端和客户端的

公司的一个项目网站,上线几天就因为磁盘暴满而出了问题,由于其服务器都集中在某一IDC机房内,所以考虑部署套Nagios监控报警系统,考虑到其它项目网站可能有类似需求,所以将其安装过程整理成脚本,方便以后的工作。Nagios服务器自动安装脚本,如下所示(此脚本在Centos5.5|5.6|5.8 x86_64下通过):

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

<code>yum -y </code><code>install</code> <code>httpd gcc gcc-c++ glibc glibc-common gd gd-devel</code>

<code>useradd</code> <code>nagios</code>

<code>groupadd nagcmd</code>

<code>usermod</code>    <code>-G nagcmd nagios</code>

<code>usermod</code>    <code>-G nagcmd apache</code>

<code>cd</code> <code>/usr/local/src</code>

<code>wget http:</code><code>//nchc</code><code>.dl.sourceforge.net</code><code>/sourceforge/nagios/nagios-3</code><code>.0.6.</code><code>tar</code><code>.gz</code>

<code>wget http:</code><code>//nchc</code><code>.dl.sourceforge.net</code><code>/sourceforge/nagiosplug/nagios-plugins-1</code><code>.4.13.</code><code>tar</code><code>.gz</code>

<code>wget http:</code><code>//prdownloads</code><code>.sourceforge.net</code><code>/sourceforge/nagios/nrpe-2</code><code>.13.</code><code>tar</code><code>.gz</code>

<code>tar</code> <code>zxvf nagios-3.0.6.</code><code>tar</code><code>.gz</code>

<code>cd</code> <code>nagios-3.0.6</code>

<code>.</code><code>/configure</code> <code>--with-</code><code>command</code><code>-group=nagcmd --prefix=</code><code>/usr/local/nagios</code>

<code>make</code> <code>all</code>

<code>make</code> <code>install</code>

<code>make</code> <code>install</code><code>-init</code>

<code>make</code> <code>install</code><code>-config</code>

<code>make</code> <code>install</code><code>-commandmode</code>

<code>make</code> <code>install</code><code>-webconf</code>

<code>cd</code> <code>../</code>

<code>tar</code> <code>zxvf nagios-plugins-1.4.13.</code><code>tar</code><code>.gz</code>

<code>cd</code> <code>nagios-plugins-1.4.13</code>

<code>.</code><code>/configure</code> <code>--prefix=</code><code>/usr/local/nagios</code> <code>--with-nagios-user=nagios --with-nagios-group=nagios</code>

<code>make</code> <code>&amp;&amp; </code><code>make</code> <code>install</code>

<code>tar</code> <code>zxvf nrpe-2.13.</code><code>tar</code><code>.gz</code>

<code>cd</code> <code>nrpe-2.13</code>

<code>.</code><code>/configure</code>

<code>make</code> <code>install</code><code>-plugin</code>

<code>make</code> <code>install</code><code>-daemon</code>

<code>make</code> <code>install</code><code>-daemon-config</code>

<code>htpasswd -</code><code>bc</code> <code>/usr/local/nagios/etc/htpasswd</code><code>.</code><code>users</code> <code>nagiosadmin</code>

<code>nagiosadmin101</code>

<code>echo</code> <code>"</code><code>alias</code> <code>nagioscheck='</code><code>/usr/local/nagios/bin/nagios</code> <code>-</code><code>v</code>

<code>/usr/local/nagios/etc/nagios</code><code>.cfg' " &gt;&gt; </code><code>/root/</code><code>.bashrc</code>

<code>source</code> <code>/root/</code><code>.bashrc</code>

<code>chkconfig nagios on</code>

<code>chkconfig httpd on</code>

<code>service httpd start</code>

<code>service nagios start</code>

#基本安装过程这里就不重复了,htpasswd -bc这行代码的作用是不需要人为干预的生成密码名为nagiosadmin101的angiosadmin用户,而后期由于经常要修改/usr/local/nagios/etc/nagios.cfg配置文件,所以需要检测其语法,所以将其长命令生成名为nagioscheck的别名命令。

Nagios客户端自动安装脚本,如下所示:

<code>make</code>

<code>chown</code> <code>nagios:nagios </code><code>/usr/local/nagios</code>

<code>chown</code> <code>-R nagios:nagios </code><code>/usr/local/nagios/libexec</code>

<code>sed</code> <code>-i </code><code>'s@allowed_hosts=127.0.0.1@allowed_hosts=114.112.11.11@'</code><code>/usr/local/nagios/etc/nrpe</code><code>.cfg</code>

<code>/usr/local/nagios/bin/nrpe</code> <code>-c </code><code>/usr/local/nagios/etc/nrpe</code><code>.cfg -d</code>

<code>echo</code> <code>"/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d"</code> <code>&gt;&gt; </code><code>/etc/rc</code><code>.</code><code>local</code>

#allowed_hosts这行是将原先的127.0.0.1由现在的服务器地址114.112.11.11地址代替(已作无害处理),这行代码大家可以根据实际需要考虑是否增加,接下来的工作就是调试Nagios服务器端了,具体过程这里略过。

事实上,在机器进IDC机房之前,像nagios和puppet客户端软件,应该在每台上线机器上部署安装好,机器上线前肯定首先是集中在自己的局域网内Kickstart后然后初始化,这时网络稳定、调试也方便,所以用puppet自动化维化既方便又省力,这样免得机器上线以后又远程维护安装,即耗了人力成本,而且也增加了机器风险。另注:我看许多朋友都是自行编写SHELL脚本作为Nagios插件来作为对MySQL主从同步的补充功能,其实Nagios中有自带的check_mysql及check_mysql_health插件来实现,由于check_mysql在部署过程中老是频繁报“段错误”,所以目前主要还是用check_mysql_health,因为我们不仅仅是监控从机上面的SQL和IO进程,更重要的是,我们要监控从机的延迟时间。

本文转自 抚琴煮酒 51CTO博客,原文链接:http://blog.51cto.com/yuhongchun/1108612,如需转载请自行联系原作者