问题描述
用户误将RH5885v2服务器的一块硬盘拔出,过一个小时再插回去,服务器鸣叫,插回去的硬盘告警。
告警信息
显示告警:Hard disk drive fault
处理过程
1、重启服务器按“Ctrl+H”进入RAID配置界面(WebBIOS)。发现新插回的硬盘显示PD Missing。
2、选中如图中显示为黑色的盘,并选中Properties选项,点击GO
3、选中Make Unconf Good选项,点击GO,如下图
4、选中Replace Missing PD,点击GO,如下图
5、选中Make
Online,点击GO,如下图
6、选择YES,此时磁盘显示online,告警消失,服务器停止鸣叫。
7、数据一致性校验。选中左侧的Virtual Drives,选择Check Consistency,点击GO,如下图。
8、查看Abortprogressoperation,当VDO%checkconsistencyprogress为100%完成数据一致性校验。
9、重启服务器正常进入系统。
根因
服务器硬盘拔出后再插回去,服务器发现该硬盘非新硬盘,PD missing:backplane,slot0(热插拔,丢失状态)RAID卡无法同步。出于保护机制,不会采取自动同步措施且插回去的硬盘显示offline。当重新online时,为了验证被拔硬盘,操作系统会提示异常关机。此时***拔的硬盘有损系统文件造成系统无法正常进入。通过进行数据一致性校验,可以保证RAID1的成员盘数据一致即***拔的硬盘和原硬盘数据同步。
解决方案
1、 将硬盘online;
2、进入数据一致性校验。
建议与总结
服务器硬盘误拔出后,为不影响业务可插入新硬盘让其自动同步。如果无新硬盘,待业务空闲期迁空服务器上业务,进行重启服务器操作,期间服务器离线一个多小时。