5月17日,星期一一早,东方彩虹的nas群里又有报修,离上周五换完机箱仅仅一个周末,现在是勤诚的机箱了,所以之前判断的国鑫背板的问题立不住脚了,需要进一步分析。
当然先解决问题,不希望再拉回硬盘来一次全盘扇区复制。
赵宇周一下午搭平台做了测试,raid5两块盘离线,强制上线,阵列恢复正常。决定周二这样操作。
结果是顺利上线,设备正常。
基于周一晚上跟道通和梁德祥的沟通,今天把机器换了个机房。
现在不能排除软件问题,但还是不能完整的推导到软件这边来。
在春节前把24盘的阵列搞定后,节后又出了问题,当时借火星的盘还没换,拉回来重新删除raid又搞了一次。
4月19号,报修,是后面12盘的阵列掉了两块盘,这次是间隔7小时,rebuild过程第二块盘掉了。拉回来又创建了raid,最后搞定。这次用了手里的nas软件,不用用户搬回机器就能解决。
后来一哥们儿说国鑫机箱背板设计有问题,问题会导致的现象跟机器上的问题可以对号入座,就更换了勤诚机箱,周五刚换完,周一就报修了。
这次看硬件全换过了,继续搞,又进一步学习了,应该给东方彩虹颁个奖,最佳学习场景提供奖。
网友评论