天天看點

Nagios②:工作原理

監控的本質

伺服器有很多種:web網頁伺服器、遊戲伺服器、資料庫伺服器、應用伺服器、中央日志伺服器等等等等。這些伺服器就是公司在網際網路上的命根子,要保證這些命根子的安全存活就是每一位運維工程師的基本職責。而Nagios就是一款監控軟體,主要任務就是監控各個伺服器的實時或者曆史的情況。

伺服器說白了就是一個進階的電腦,它的硬體裝置不外乎就是CPU、記憶體、磁盤容量、網卡、滑鼠鍵盤顯示器等部分。而我們需要監控硬體也無非就是監控以上幾項。

CPU:了解其使用百分比,通過百分比能了解CPU對所有任務的處理情況

記憶體:了解已用和可用記憶體數,進而了解系統記憶體開銷

磁盤容量:對磁盤空間餘量的掌握能了解磁盤記憶體是否還夠用

網卡:網卡的吞吐率了解網絡上行下行的情況,避免網絡堵塞

上面說的是硬體部分,下面說說軟體部分。

以網頁伺服器為例,一般來說一個網頁伺服器内部所安裝的重要軟體無外乎就是以下幾種:Apache、Tomcat、Nginx。而這三位主要監控的對象就是“端口存活和可達狀态“,進而推斷HTTP服務是否正常。其實無論是硬體資料還是軟體資料在linux上都有對應的指令可以顯示,但是由于運維人員所要負責的伺服器可能較多,一台一台的輸指令比較無聊,而且linux回報的是數字而不是圖像那種更加直覺的形式,況且當數值到達門檻值的時候,監控軟體可以采取應急措施并且通過郵件或者短信形式通知負責人,是以引入監控軟體是很有必要的。

Nagios的工作原理

一般來說,企業内部的網絡拓撲圖應該是這個樣子的。

<a href="http://s4.51cto.com/wyfs02/M00/7E/EB/wKiom1cMun_CZAqmAAGG_tpnOs0506.png" target="_blank"></a>

而nagios可能就安裝在上面“應用伺服器”中的某一台,由于這幾個伺服器在同一個網段,他們之間是可以互相通信的,是以nagios就可以采集到其他伺服器的硬體軟體資料,然後我們可以登陸nagios伺服器,以網頁的形式輸出這些資料。

<a href="http://s3.51cto.com/wyfs02/M02/7E/ED/wKiom1cM4ZORzrnWAAEdWr-uC1Y855.png" target="_blank"></a>

nagios的工作基本原理就是上面的圖,監控主機上安裝了nagios軟體,而nagios就通過check_nrpe子產品以SSL協定與目标伺服器的NRPE子產品進行通信,目标伺服器的NRPE子產品收到監控指令後,啟動check_disk等外部插件對目标機器進行資料采集,然後将采集結果傳回到NRPE子產品,再有NRPE子產品呈遞給監控主機的nagios core,而nagios将這些資訊通過cgi解析,以web網頁的形式呈現在螢幕上供從業人員觀看。

 本文轉自 蘇幕遮618 51CTO部落格,原文連結:http://blog.51cto.com/chenx1242/1763067

繼續閱讀