對于IT管理者而言,遭遇raid資料災難總很頭疼,資料恢複工程師是raid恢複的主要人員,然而管理者的誤操作對raid恢複的可能性有至關重要的責任,那麼管理者如何操作才能提高raid5資料恢複成功率?總結起來就是如下幾點:
1.伺服器硬碟出現故障後,不要強行上線
2.保護好第一現場
3.選擇專業資料恢複公司
伺服器硬碟出現故障後,不要強行上線
在伺服器的某一個硬碟出現故障時,一般伺服器都會有一個Offline訓示燈提示,此時要求使用者更換一個完好的相同硬碟,并且重新校驗算法。按理說這是非常正常的操作過程,但是殊不知很多RAID災難就是由此而引起的。
以一個硬碟數量比較多的RAID5磁盤陣列為例,很可能同時采購的多個硬碟中,有幾個已經出現了不穩定現象。而伺服器的Offline提示可能并不是最準确的,經常會誤報(也有硬碟不穩定的因素)或是遺漏其它也同樣存在隐患的硬碟。在看似平常的強制上線過程中,硬碟需要進行大量的讀寫操作,此時就是一場嚴峻的考驗:運氣好的話自然平穩度過,而運氣不好就會導緻其它硬碟突然掉線,此時就令問題更加棘手了。
當然,出現一個硬碟掉線提示,或是在RAID容錯範圍以内的掉線提示,強制上線還是必須執行的操作。但是在進行這一步前,強烈建議大家檢測一下每一個硬碟的穩定性情況,這樣才更加保險。大家可不要忽視這樣一個小細節,往往這一步能夠讓RAID伺服器沒免于癱瘓。
保護好第一現場
對于廠商而言,所有的質保承諾僅僅局限于硬體裝置,也就是說磁盤陣列故障後所引發的資料危機與之毫無關系,負責為使用者更換或者維修已經算是“克盡職守”。但是使用者所需要的并不是找回硬碟或是重建RAID,而是更價值不菲的資料。如果尋找整機廠商,此時無異于“自讨苦吃”,因為所謂的售後服務根本沒有從使用者的本源需求出發,盡快確定硬體裝置完好反而犧牲了資料。當然,知名品牌的伺服器廠商或是代理商會主動選擇為大客戶的RAID資料恢複服務費“埋單”,但是這也僅僅是個别情況。
據資料恢複中心的主管工程師介紹,因為尋找服務商的售後服務工程師修複而導緻最終資料徹底破壞的案例幾乎每個星期都會發生。畢竟售後服務工程師基本都偏向于硬體,而RAID資料恢複則是以軟體類操作為主。
此外,即便是簡單的檢驗性操作,也有可能為後期的資料恢複帶來不便。以普通RAID5恢複為例,當硬碟損壞超過容錯能力時,必須将損壞硬碟的鏡像完全提取才能進行最終的恢複。而如果頻繁對硬碟上電,很容易造成磁頭進一步疲勞損傷,甚至劃傷盤片。正确的處理方法應當是立即咨詢專業資料恢複服務商。
選擇專業資料恢複中心
根據資料恢複中心的統計,很多資料恢複失敗的案例都是因為使用者尋求了并不正确的解決途徑。伺服器使用者所依靠的售後服務也往往不夠專業,RAID磁盤列陣出現問題之後輕易選擇重建,資料丢失情況更是雪上加霜。在選擇資料恢複服務商時,根據規模以及業界口碑來判斷是一條可行的捷徑。公司規模、技術水準、工程師團隊都是需要考量的重要名額,能夠幫助廣大遭遇RAID資料災難的使用者及時恢複資料,挽回損失。
本文轉自 宋國建 51CTO部落格,原文連結:http://blog.51cto.com/sun510/2069042,如需轉載請自行聯系原作者