前兩天一個朋友打電話過來說他的一個客戶的資料丢失了,讓我幫忙去看一下。
問題是這樣的:
伺服器一直開着,并且正常使用,使用者突然發現資料無法正常通路,在磁盤管理中有實體硬碟但是顯示無法讀取。用HP的陣列管理軟體能夠檢視陣列狀态,顯示正常。
硬體:
系統Win2003
HP的伺服器(型号忘記了)用的雙機熱備 心跳線連接配接
存儲使用的是MSA1000,滿盤300G 14塊
存儲伺服器之間用光纖HUB連接配接,采用了群集管理
存儲采用了雙控制器,主從關系
兩台伺服器也分别采用了雙卡結構
先檢查陣列連接配接方式,發現線是很多,不過把備援去掉,就是簡單的 伺服器-HUB-存儲的連接配接方式,在管理軟體中顯示正常說明陣列應該沒有太大問題,估計問題出在系統上。一般像這種伺服器使用雙光纖卡的應該有仲裁軟體,檢視系統并咨詢HP工程師,确定存在這個軟體。
解決過程:
重裝軟體無效,找另外一台機器安裝系統+軟體,直接連接配接存儲成功識别。然後備份原系統資料,重裝系統故障解決。
這個案例讓我想起好久之前一個案子
問題:
系統Red hat 9,從業人員誤删除将網站資料清除,EXT3檔案系統
因檔案量巨大,目錄結構複雜,初步估計沒戲,死馬也當活馬醫。
存儲MD3000,共3T,采用雙控,每個控制器又有兩條光纖線
存儲為3組伺服器提供服務
通過光纖HUB連接配接
其中一組伺服器為 1950
分析過程:
在目前系統下檢視磁盤資訊,的确是使用了 删除指令,水準所限 一般分析都是在windows下進行,要求客戶提供台Windows伺服器,還好客戶有備用機,安裝系統,連接配接存儲,在磁盤管理中能夠看到2個相同的磁盤但是顯示無法通路,當時是第一次遇到這種問題,嘗試直連盤櫃,無效,後來咨詢Dell客服,确認需要安裝仲裁,磁盤能夠正常識别。
通過工具分析,和當初判斷結果一緻,完整目錄肯定是無法實作的,按檔案類型可以恢複,但這樣對使用者來講無用。
宣布失敗…
這次收獲是學會了在較複雜的伺服器方案中,如何去連接配接存儲。