天天看點

面對多變性天氣,IT經理如何確定安全運維?

面對多變性天氣,企業it機房和資料中心同樣面臨管理、安全等多方面考驗。

it機房和資料中心對企業業務發展尤為重要,由于國内氣候環境的多變性,為it運維管理帶來了巨大挑戰。夏季機房,it經理不僅要解決機房溫度濕度、保障伺服器裝置穩定運作及確定資料安全等問題,還要承受降低企業總體擁有成本的壓力。

我們知道大多數機房都建有制冷系統,來保證内部溫度在22℃的安全線以内。但是,夏季持續性高溫會多引發系統、硬體異常工作,甚至是癱瘓罷工,且機房和資料中心的内部溫度比平均水準每升高10度,資料中心“融化”的風險就會提高5%。如何確定機房或資料中心在高溫多雨天氣下安全、穩定的運維,成為衆多it經理當下迫切希望解決的問題。

作為企業的cio或it管理者如何解決這些“熱”煩惱、“雨”擔憂,不妨從以下幾方面着手做起。

強化資料中心制冷系統

資料中心,支撐整個企業it系統正常運轉的背景架構,其包含計算、存儲、網絡等多種高性能、高密度硬體裝置。如伺服器、儲存設備在作為動力源同時也成為熱源的生産者,再加之夏季溫度一再攀升,it經理不得不采取措施,強化制冷系統,確定内部溫度在安全線以内。

第一,結合企業自身資料中心架構布局,建設可随負荷變化的管理制冷系統。在滿負載工作情況下,可提供足夠的冷量和風量;不滿負荷情況下,制冷系統可提供恰當的風量,在保證精确調節同時,也能更好的綠色節能,節約成本。

第二,根據資料中心不同密度區域,采用不同的制冷形式。例如,可在刀片伺服器高密度區域采用水冷機櫃等。

第三,可選用氣流送風技術,但要做到非常均勻的送風,實際操作則具有一定難度,在此不建議中小企業采用。

小結:資料中心制冷系統強化,需cio依據内部設施布局進行慎重建設。

選擇合适的伺服器裝置

除了通過強化資料中心制冷系統外,從硬體基礎設施出發同樣能做到節能降耗、平台正常運轉功效。面對極端環境或特殊應用的需求,裝置生産商精益求精,針對高溫環境推出耐高溫伺服器或自帶降溫技術裝置的整體解決方案,例如戴爾poweredge伺服器就可在-5℃到45℃之間正常運作。

戴爾為了確定企業資料中心的伺服器、存儲等裝置能夠在高溫環境正常運作,降低額外的維護和基礎設施成本,在研制耐高溫伺服器同時,為企業資料中心打造新風冷卻解決方案。借助該解決方案組合不僅具備高散熱能力和可靠性等優勢,還使得方案中的伺服器、存儲和網絡裝置允許在更高溫度條件下安全、穩定的運作,避免因高溫當機“罷工”現象。

小結:it機房或資料中心擁有良好的伺服器、儲存設備不僅能降低it故障率,更重要的是降低了企業tco。

建立裝置實時監控機制

企業it機房裝置(伺服器、存儲、交換機等)絕大部分是24×7小時運作,面對高溫、多雨季節,企業應建立裝置實時監控機制。監控機制包括兩部分:員工實時檢查和網絡實時監測。

企業部署相關員工對伺服器裝置運作資料進行按日分析,并整理出伺服器工作日志,以便第一時間處理異常現象;同時對伺服器機房進行按日檢查,避免人為諸如機房亂堆放雜物、有灰塵等情況幹擾伺服器正常運作。另一方面,企業選擇一套伺服器監控解決方案,對伺服器進行實時監控,一旦出現當機、存儲硬碟受損及時發出警報,第一時間安排相關技術人員進行整修。

伺服器、存儲提供商在保障産品品質外,還會為其定制或添加多功能工具和軟體,以應對企業多方面需求。而戴爾作為中國伺服器第一大提供商,在産品日常維護方面更是行業第一。戴爾12g伺服器内置硬體診斷工具diagnostics,且無需依賴作業系統,若診斷出硬體不能正常工作,會自動發出警報;同時,戴爾為使用者提供openmange essentials系統管理軟體,提供免代理監控服務。

除戴爾伺服器外,ibm、hp、華為等伺服器均有類似診斷工具或管理軟體。

小結:人無遠慮,必有近憂。企業亦如此,單純依靠人工進行裝置實時監控,必将投入大量人力物力。是以,選擇成套的伺服器監控解決方案才是最佳監控措施。

制定災難備份修複方案

夏季機房突發情況有許多,諸如機房斷電、伺服器當機、存儲硬碟損壞等等,為保證機房正常運作,防患于未然,企業在夏季做好相應的災備措施具有重大意義。

既然裝置故障問題(伺服器當機等)不可避免, it經理就需在購買裝置時與相關it專家進行讨論,分析企業可能會出現故障的情況,并将這些情況分析結果形成意見,制定一套災備修複方案,以減少因故障而帶來的損失。具體方案有:

加強裝置維護檢查,制定裝置在夏季運作方案;儲備或協調後備應急水源及燃料,保證在斷電、斷水情況發生時有足夠的備用資源;以主動措施應對被動狀況,例如儲備應急冰塊、購置通風用軸流風機、水噴淋措施等。

小結:做好災備修複方案對企業來講至關重要,不僅保證了平台正常運作,還進一步確定了資料的安全性。

做好防水、防雷安全措施

it機房或資料中心做好上述幾點就萬無一失了嗎?答案顯然是否定的,企業機房還需做好防水、防雷等安全措施。

機房内擺放着大量的精密、貴重計算機及網絡裝置,其均具備高密度、高速度、低電壓和低功耗等特性,不僅怕水,還對各種諸如雷電過電壓、電力系統操作過電壓、靜電放電、電磁輻射等電磁幹擾非常敏感。如果防護措施不力,企業随時可能遭受重大損失。

夏季多雨,機房更應防止漏水事故發生。it經理可直接通過降低機房空調供水管道的壓強來解決漏水隐患。通過對機房專用空調加濕器的供水系統的分析,專家認為機房專用空調加濕罐補水時并不需要過高的供水壓力,相反降低了機房空調供水管道的壓強,可使供水管道中的閥門、接頭、彎頭、管壁所承受的壓力降低,安全系數提高,有利于機房空調安全供水的實作。

有雨必有雷。為了保護建築物和建築物内各項電子網絡裝置不受雷電損害或使雷擊損害降低到最低程度,應從整體防雷的角度來進行防雷措施的設計。it機房主要應從ups電源系統防雷保護、通訊系統的防雷與過電壓保護及防雷器的安裝與接線着手做起。

小結:盡管it機房在建設之初已經做過防水、防雷、防震等突發災難措施,但在夏季多雨時節,仍需做好檢查和防禦措施,防患于未然。

随着大資料崛起、雲計算漸成企業寵兒,各類計算越來越依賴資料中心;業務的多樣化,也對it機房的裝置管理、運維以及安全等多方面提出了更高要求。面對故障多發期,夏季對機房和資料中心來講均是一個嚴峻的考驗。是以,it經理做好夏季機房故障防禦措施十分重要。

面對夏季對機房多方面影響,it經理除了采取一定有效措施防禦故障發生外,更希望在保證平台正常運維下降低企業tco,來提升整體能效。據datacenterusersgroup調查顯示,資料中心能效已迅速成為業界優先考慮事項。絕大多數受調查者認為,資料中心在制冷裝置(49%)、伺服器(46%)、電源裝置(39%)和儲存設備(21%)等方面存在巨大的能效改善機會。由此可見,企業迫切降低投入、運維等成本。而最直接、最有效做到這一點的方案就是,企業在為機房采購裝置時,從一開始就選擇具備低能耗、耐高溫等特性裝置或成套解決方案,不僅可以有效減少故障率,亦能夠降低企業整體擁有成本。

本文轉自d1net(轉載)