天天看點

伺服器資料恢複-EMC存儲raid5磁盤陣列資料恢複案例

作者:北亞資料恢複中心

伺服器資料恢複環境:

某公司一台EMC某型号存儲中有一組由12塊硬碟組建的raid5磁盤陣列,其中有2塊盤作為熱備盤使用。

伺服器故障&分析:

raid5磁盤陣列中有2塊磁盤離線,隻有1塊熱備盤成功啟用,另外一塊熱備盤未啟用,raid陣列崩潰。

伺服器硬碟離線的原因無非為磁盤出現實體故障或者硬碟出現壞道。由于EMC的raid控制器磁盤檢查政策比較嚴格,經常将陣列中性能不穩定的磁盤判定為實體故障并踢出陣列。是以導緻EMC存儲中磁盤陣列崩潰的原因有可能是由于磁盤讀寫不穩定。

伺服器資料恢複過程:

1、将故障存儲中所有磁盤編号後取出,由硬體工程師對所有磁盤做實體故障檢測,經過檢測發現沒有磁盤存在實體故障和壞道。以隻讀方式将所有磁盤做全盤鏡像備份,備份完成後将所有磁盤按照編号還原到原存儲中。後續的資料分析和資料恢複操作都基于鏡像檔案進行,避免對原始磁盤資料造成二次破壞。

伺服器資料恢複-EMC存儲raid5磁盤陣列資料恢複案例

北亞企安資料恢複——ZFS檔案系統資料恢複

2、基于鏡像檔案分析原RAID5磁盤陣列結構,經過分析發現2塊熱備盤上沒有資料,其中一塊熱備盤已成功激活并替換了其中的一塊離線磁盤,但資料并未同步。繼續分析條帶大小、資料的分布規律、磁盤順序等raid相關資訊,發現有一塊盤在同一條帶上的資料與raid中其他硬碟不同,初步判斷該盤為掉線較早的硬碟。使用北亞企安自主開發的raid校驗程式對此條帶進行校驗,确認這塊盤為先掉線的盤。通過分析擷取到的raid相關資訊虛拟重構原raid5磁盤陣列。

3、對磁盤陣列中的LUN資訊進行分析後解釋map資料并導出。使用北亞企安自主開發程式解釋zfs檔案系統,某些檔案系統中的檔案在解析過程中報錯。北亞企安資料恢複工程師手動debug程式做後發現報錯的原因是ZFS檔案系統在進行I/O操作時raid陣列崩潰導緻某些元檔案損壞,程式無法正常解釋。隻有修複好損壞的檔案系統元檔案後,才能使用程式解析ZFS檔案系統。

4、使用程式解析修複好的ZFS檔案系統,解析所有檔案節點及目錄結構。經過使用者方工程師的反複驗證,确認恢複出來的資料完整可用。

部分檔案目錄和驗證截圖:

伺服器資料恢複-EMC存儲raid5磁盤陣列資料恢複案例

北亞企安資料恢複——ZFS檔案系統資料恢複

伺服器資料恢複-EMC存儲raid5磁盤陣列資料恢複案例

北亞企安資料恢複——ZFS檔案系統資料恢複

伺服器資料恢複-EMC存儲raid5磁盤陣列資料恢複案例

北亞企安資料恢複——ZFS檔案系統資料恢複

繼續閱讀