在运维过程中,服务器硬盘故障与更换可能是比较频繁的一个工作。或自己动手更换、或指导更换、或提供更换方案。不同的服务器厂商有着各自不同的硬件管理标准,可能导致更换的新硬盘无法被操作系统识别。而厂商或许给的建议是,重启机器在开机的Raid卡管理界面配置一下就好了...就好了..就好了....。业务在运行,不能因为一块磁盘故障就关机停业务啊。
在系统中是可以对硬盘管理的。但这需要运维人员有一定的技术积累,和能否找到这篇文章(嘿嘿。。俏皮一下)
首先在各大厂商中,HP的服务器还是不错的,有自己的管理工具。本文主要介绍的是除HP外,其他使用 LSI 的厂商。
新更换的硬盘不能被识别,常见的有两种情况,一种是需要做JBOD、另一种是需要做单盘Raid0。做JBOD的方法请参考另一篇文章【服务器新盘无法识别(JBOD)】
查看磁盘信息
这里主要关注Number of Virtual Disks这个值,12块磁盘正常情况看到的应该 有12个逻辑盘,我这里故障一个所以看到了11个 。反正能看到很多个,而且是一个磁盘一个raid,这就是所谓的单盘raid0。
#/opt/MegaRAID/MegaCli/MegaCli64 -ldpdinfo-aAll
Adapter #0
Number of Virtual Disks: 11
Virtual Drive: 0 (Target Id: 0)
Name :
RAID Level : Primary-0, Secondary-0, RAID Level Qualifier-0
Size : 446.102 GB
Is VD emulated : Yes
Parity Size : 0
State : Optimal
Strip Size : 256 KB
Number Of Drives : 1
Span Depth : 1
Default Cache Policy: WriteThrough, ReadAhead, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteThrough, ReadAhead, Direct, No Write Cache if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy : Enabled
Encryption Type : None
PI type: No PI
Is VD Cached: No
Number of Spans: 1
Span: 0 - Number of PDs: 1
PD: 0 Information
Enclosure Device ID: 0
Slot Number: 0
Drive's postion: DiskGroup: 0, Span: 0, Arm: 0
Enclosure position: 1
Device Id: 3
WWN: 5001173100f9605c
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA
Raw Size: 447.130 GB [0x37e436b0 Sectors]
Non Coerced Size: 446.630 GB [0x37d436b0 Sectors]
Coerced Size: 446.102 GB [0x37c34800 Sectors]
Emulated Drive: Yes
Firmware state: Online, Spun Up
Commissioned Spare : No
Emergency Spare : No
Device Firmware Level: RP41
Shield Counter: 0
Successful diagnostics completion on : N/A
SAS Address(0): 0x500e004aaaaaaa00
Connected Port Number: 0(path0)
Inquiry Data: A01CD572SDLF1DAR480G-1HHS ZR04RP41
FDE Capable: Not Capable
FDE Enable: Disable
Secured: Unsecured
Locked: Unlocked
Needs EKM Attention: No
Foreign State: None
Device Speed: 6.0Gb/s
Link Speed: 6.0Gb/s
Media Type: Solid State Device
Drive Temperature :28C (82.40 F)
PI Eligibility: No
Drive is formatted for PI information: No
PI: No PI
Port-0 :
Port status: Active
Port's Linkspeed: 6.0Gb/s
Drive has flagged a S.M.A.R.T alert : No
查看物理磁盘信息
新更换的硬盘使用这条命令可以看到,但是系统里面看不到。这是就可以判断你的系统需要做单盘raid0才能识别硬盘了。
/opt/MegaRAID/MegaCli/MegaCli64 -pdlist -aAll
查看是否有原逻辑盘的数据在cache中
MegaCli64 -GetPreservedCacheList -a0
根据提示清理
MegaCli64 -DiscardPreservedCache -L{根据上文提示的L逻辑盘数字编号} -a0
制作单盘raid0
/opt/MegaRAID/MegaCli/MegaCli64 -CfgLdAdd -r0[8:5] WB RA Direct CachedBadBBU -a0
网友评论