天天看點

IBM伺服器巡檢流程

好多朋友短信内找我要,我就把這個整理一下貼出來吧,大家UPUP啊。

1、檢查系統硬體情況:裝置故障燈是否有亮

2、系統錯誤報告(errlog)

3、有否發給root使用者的錯誤報告(mail)

4、檢查hacmp.out,smit.log,boot.log

5、關鍵系統的檔案使用率不大于80%

6、邏輯卷有否stale

7、記憶體交換區使用率是否超過70%

8、記憶體交換區的大小是否為實體記憶體的1.5倍

9、檢查備份情況(有否系統備份、使用者資料備份、錄音帶機是否需要清洗)

10、通信(網卡、IP、路由表、ping、/etc/hosts、DNS設定等)

11、是否有資料保護方式如RAID10/RAID5,是否有Hot spare

12、系統DUMP設定是否正确

13、檢查系統參數是否正确

1)/etc/enviroment中的TZ不能有夏時制

2)如有資料庫:Aio:available

3)HACMP中I/O pacing:High Water Mark/Low Water MArk:33/24

4)HACMP中Syncd:10

5)HACMP中Power Monitor:off

14、檢查rootvg是否有鏡象

15、檢查errdemon,srcmstr是否正常運作

16、機房環境(電壓、濕度)

17、系統性能:有否性能瓶頸(topas,vmstat)

18、更新檔程式(PTF)、微碼(是否需要更新)

19、HACMP測試:Cluster Verification

20、系統硬體診斷

21、運作#snap -ac,生成檔案snap+s/n.pax.Z

22、機器清潔

繼續閱讀