問題描述
使用者誤将RH5885v2伺服器的一塊硬碟拔出,過一個小時再插回去,伺服器鳴叫,插回去的硬碟告警。
告警資訊
顯示告警:Hard disk drive fault
處理過程
1、重新開機伺服器按“Ctrl+H”進入RAID配置界面(WebBIOS)。發現新插回的硬碟顯示PD Missing。
2、選中如圖中顯示為黑色的盤,并選中Properties選項,點選GO
3、選中Make Unconf Good選項,點選GO,如下圖
4、選中Replace Missing PD,點選GO,如下圖
5、選中Make
Online,點選GO,如下圖
6、選擇YES,此時磁盤顯示online,告警消失,伺服器停止鳴叫。
7、資料一緻性校驗。選中左側的Virtual Drives,選擇Check Consistency,點選GO,如下圖。
8、檢視Abortprogressoperation,當VDO%checkconsistencyprogress為100%完成資料一緻性校驗。
9、重新開機伺服器正常進入系統。
根因
伺服器硬碟拔出後再插回去,伺服器發現該硬碟非新硬碟,PD missing:backplane,slot0(熱插拔,丢失狀态)RAID卡無法同步。出于保護機制,不會采取自動同步措施且插回去的硬碟顯示offline。當重新online時,為了驗證被拔硬碟,作業系統會提示異常關機。此時***拔的硬碟有損系統檔案造成系統無法正常進入。通過進行資料一緻性校驗,可以保證RAID1的成員盤資料一緻即***拔的硬碟和原硬碟資料同步。
解決方案
1、 将硬碟online;
2、進入資料一緻性校驗。
建議與總結
伺服器硬碟誤拔出後,為不影響業務可插入新硬碟讓其自動同步。如果無新硬碟,待業務空閑期遷空伺服器上業務,進行重新開機伺服器操作,期間伺服器離線一個多小時。