那天上午一个客户遇到一个棘手的问题,客户的设备是一台十二盘位的服务器接一台12盘位的扩展柜,现在是12盘位扩展柜出问题了,因为机房掉电,重启后扩展柜所以硬盘闪红灯,具体情况还不太清楚。
分析问题:主机和扩展柜开机顺序很关键,推导的顺序应该是这样的,开机顺序是先开扩展柜,后开主机,因为扩展柜需要准备好硬盘可以被主机RAID卡识别,否则raid卡启动认不到盘。关机顺序应该是先关扩展柜,后关主机,因为如果先关扩展柜的话系统会继续向里面写数据,导致数据丢失。
大概饭后不到一个小时,同事就测完了,结论是断电顺序重要,启动顺序不重要,启动时主机需要自检,到raid卡检硬盘的时间还挺长,而扩展柜启动给背板、硬盘加电时间很短,所以只要开机时间只是差几秒一般没事。
这样可以推论出来客户是扩展柜先掉电,主机后掉的电。理论上,只要从raid卡的bios把磁盘导入,就能解决。盘上数据判断也不会有太大问题,raid信息和存储数据应该都没事,但提前把raid参数记录下来,即使有问题尝试删除raid信息,再重新做raid,大概率能找回数据。
后来就按照实验的流程帮客户制作了操作方案。
网友评论