這幾年越來越多的企業在國家号召和行業巨頭的影響之下,開始有了自動化運維的概念,但是到底怎麼做才算自動化運維,每家公司的了解都不太一樣。
**在我看來,要建立什麼要的運維平台,其實标準答案不确定,要看公司的IT規模和技術水準。**比如公司有幾十台、幾百台還是成千上萬台機器;比如使用傳統的linux伺服器直接跑中間件,還是已經使用了容器技術,通過docker加載輕量級的中間件;比如公司的業務性質,是傳統的制造型企業、營銷型企業、銀行等金融行業亦或者是網際網路服務公司;還要看IT部分有多少預算和人力、财務和物力。 這個問題其實很複雜,需要考慮好多問題。今天我就以A企業為例,講講我們遇到的大公司病。
**先從資源管理方面講講。**A企業的規模很大,全國幾十家企業,每家企業各種分公司和子公司,IT的規模可能是海量的。IT基礎設施層面可能有各種各樣的伺服器,刀片伺服器、小型機、大型機;各種各樣的存儲、網絡、安全裝置;各種各樣的作業系統,windows、Linux、AIX等。于是可能好多人想到的是,先要建立一個強大的CMDB系統,手工錄入各種繁雜的子資源,然後系統就生成的各種各樣的報表和分析資料,感覺高、大、上,但是然後這好像隻會讓财務部門很開心,但是IT部門就會發現,難道我們就是闆磚、整理資料出報表的命了。随着A企業推動資訊化的程序加速,于是又産生了好多的資訊系統,A生産管理系統、A建設系統、A工程管理系統、人力資源系統、财務系統、資産管理系統甚至也産生了資訊管理系統。這些業務系統對IT基礎設施的要求都不太一樣,結果IT部門就更累了,因為資産越來越豐富了,硬體、軟體越來越繁雜了,CMDB系統原有的設計已經不能滿足要求了,于是就不斷地加入各種模型和結構。再後來,網際網路大廠提出了人工智能、大資料、雲計算、物聯網等概念,這些很快上升到了國家戰略層面。作為國企的排頭兵,A企業就積極響應國家号召,建立了各種各樣的雲計算平台、虛拟資源池,結果CMDB原有的模型簡直被颠覆了,又隻能再改造資源模型去适應了。 IT部分的大部分精力都花在了資源管理方面,别的事情精力就少多了,那就隻能加班彌補了。
**再從資源監控方面講講。**由于我們已經有了強大的CMDB系統,再要做資源監控就是順理成章的事情了。站在管理者的角度當然是有什麼監控什麼,監控名額越多越好咯。于是我們建立了豐富的運維監控名額體系,覆寫各種資源,監控名額包羅萬象。然後監控系統運作起來以後,我們就整天關注着海量的監控對象和名額,一有個什麼風吹草動,IT部門都心驚膽戰的,生怕被考核了。後來就有人提出了自動化監控,由于IT的複雜度和技術的有限,結果自動化水準一直沒有質的飛躍。