天天看點

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

伺服器資料恢複環境:

一台某品牌儲存設備上有一組由10塊硬碟(9塊資料盤+1塊熱備盤)組建的raid5陣列,上層部署vmware exsi虛拟化平台。

伺服器故障:

raid5陣列中兩塊硬碟對應的訓示燈亮黃燈掉線。硬碟序列号無法讀取,通過SAS擴充卡也無法讀取。

伺服器資料恢複過程:

1、将存儲中所有磁盤标記後取出。将掉線的其中一塊故障盤連接配接到外部的SAS擴充卡上,加電後通過硬碟聲音判斷電機可以啟動,但是磁頭沒有進行尋道操作。硬體工程師将硬碟PCB分離下來清潔HDA元件氧化部分,清潔後故障依舊。和使用者方溝通并得到同意後,硬體工程師在無塵室将熱備盤的PCB替換到故障盤上,并将故障盤PCB上的ROM晶片替換到從熱備盤上取出的PCB上面。這時硬碟的電機起轉和磁頭尋道聲音正常,但是在尋道結束後,有明顯的敲盤聲音,基本上可以判斷磁頭損壞。和使用者方溝通後使用熱備盤中的磁頭替換故障盤上的磁頭,不幸的是這塊故障盤已經無法識别,無法讀取資料。

再次和使用者方溝通後嘗試對另一塊故障盤進行修複。和第一塊故障盤一樣,這塊故障盤的磁頭損壞,通過各種管道找到相同型号的硬碟并更換磁頭。更換磁頭後這塊故障盤能夠被正常識别,于是将這塊故障盤所有扇區以隻讀方式做完整鏡像。其他完好硬碟也以隻讀方式做扇區級全盤鏡像。鏡像完成後将所有磁盤按照原樣還原到儲存設備中,後續的資料分析和資料恢複操作都基于鏡像檔案進行,避免對原始資料造成二次破壞。

2、判斷起始扇區。

所有硬碟鏡像完成後,使用工具打開9塊資料盤,9塊盤的0扇區都有“55 AA”标志。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

0x01C2H處顯示“05”,表示這是一個擴充分區。從0扇區看這是一個不正常的MBR分區結構。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

繼續往下找,在另外的2塊盤上找到了“55 AA”的标志。其中一塊盤上是一個正常的MBR分區,其0x01C6處數值代表指向的下一個扇區為GPT的頭部。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

另外一塊盤的0x01C6處數值表示指向下的一個扇區不是GPT的頭部。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

由此可以确定這2塊盤中其中一塊是第一塊盤,另外一塊盤可能是最後一塊盤。GPT分區所在扇區起始于172032扇區,是以初步确定LUN的起始扇區是172032扇區。

3、判斷條帶(stripe)大小。

條帶也稱塊,是RAID處理資料的基本單元。不同RAID的條帶大小各不相同。RAID5的1個條帶組中有1個校驗區,1個校驗區的大小等于1個條帶的大小。根據這個特征分析這個RAID5。如果對VMFS不熟悉,可以通過比較法确定條帶大小。如果某一條帶組中的校驗區和該條帶組中的非校驗區相差很明顯,通過工具檢視并對比就可以找出條帶大小。北亞企安資料恢複工程師通過上述方法判斷出本案例中條帶大小是1024個扇區。

4、判斷RAID5陣列成員盤盤序。

按照1024扇區進行分割,使一個記錄為一個條帶的大小,9塊盤跳到同一記錄283123。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

當9塊盤都定位到同一位置時,通過對比可以判斷校驗區的走向,繼而判斷整個RAID5的走向。将之前判斷出的第一塊盤放在第一個位置就可以判斷走向了。北亞企安資料恢複工程師通過上述方法判斷出本案例中raid5的走向和盤序。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

5、前面的步驟中已經确定LUN的起始扇區是172032扇區。跳到172032扇區并觀察各硬碟的情況。如果172032扇區是LUN的起始扇區,那麼這個扇區所屬條帶中的那塊盤應該是校驗區,但是此條帶中卻顯示另外一塊盤是檢驗區。根據RAID5的左走向,172032扇區所屬條帶中的那塊盤的校驗區應該在172032-1024=171008扇區,即上一個條帶。跳轉到171008扇區,卻發現校驗區為172032扇區所屬條帶顯示的另外一塊盤,是以可以确定LUN的起始扇區為171008扇區。

6、在工具中按照确定的盤序組織好磁盤并添加進去,選擇RAID5,Stripe size 512KB,左異步。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

點選Build重組raid5。由于資料從1024*8=8192個扇區開始,若工具沒有跳轉到此扇區的功能,那麼剛組好的RAID必須和一個檔案再進行一次重組操作。RAID的起始扇區選擇8192,這個檔案可以任意選擇起始扇區和大小。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

7、移交資料。RAID5重組完成後,聯系使用者方驗收資料。經過驗證,使用者方确認資料沒有問題。根據使用者方要求把資料移交到使用者方帶來的新盤上。

伺服器資料恢複—Raid5陣列兩塊硬碟磁頭損壞導緻掉線的資料恢複

北亞企安資料恢複—Raid5資料恢複

繼續閱讀