什么是RAID

硬盘是个很脆弱的东西，它经常会坏掉。所以，为了保证服务器可靠耐用，硬盘必须时时刻刻保持可用。所以有了RAID这个东西。它的目的是将好几个硬盘合并在一起，就算硬盘坏了一个，剩下还有好几个硬盘是正常的，这样服务器才不会挂掉。

当然，保证服务高可用只是RAID其中的一个功能。它还能提升储存容量、加快存取速度等能力。

RAID分为0~6级，另外还有RAID 1+0，简称RAID 10。下面分别介绍这几种RAID实现原理。

下图就是一个RAID实物图：

下图是RAID示意图：

它跟插线板是相似的概念。区别在于，插线板是为了扩展电源插孔，RAID是为了扩展硬盘插槽。

RAID-0

RAID 0没有数据冗余、没有奇偶校验。因此，如果一个硬盘坏掉了，整个RAID阵列的数据都没法正常使用了。它存在的意义在于加快读写速度，提升硬盘容量。通常在数据可靠性要求不高的情况下才会使用RAID 0。比如游戏、科学计算。

因为每个硬盘都可以独立读写，如果硬盘有n块，那么读写速度提升是n倍。

下图是RAID 0的数据分布方式：

RAID-1

RAID 1模式下，如果有n块硬盘，那么会把数据保存n份一模一样的。这样即使一份数据坏掉了，剩下的备份可以正常工作。性能方面，随机存取速度相当于所有硬盘的总和，写入性能和原来单个硬盘的性能一样。

RAID-1E

这种模式跟RAID 1的区别在于，当硬盘数量大于2时，RAID 1E对于同一份数据最多保存两份一模一样的。这样可以充分的利用硬盘空间。下图说明了这种储存方式。

RAID-1+0

这种模式全称是RAID-1加上RAID-0。它实现的原理如下图所示：

用几句话来描述吧。它相当于先把这些硬盘成对成对的用RAID-1方式组合起来，然后再把这些组合结果用RAID-0方式组合起来。这种模式下它支持高可用，又能有很好的读写性能。这种方式，由于需要存两份一模一样的数据，因此容量会损失一半。

这种方式是目前最常用的。

RAID-2

这种模式现在已经不太常用了。它把每个数据位都打散，然后均匀的放到各个硬盘上。使用了Hamming代码来做纠错，将Hamming代码放到专门的几个硬盘里面。下图可以看到这种模式的数据分布：

RAID-3

这种模式现在也已经不太常用了。它把每个数据字节都打散，然后均匀的分散到各个硬盘。然后将奇偶校验的数据放到专门的硬盘里。关于奇偶校验的数据在后面会提到。这种模式下，由于每个数据都分散到各个硬盘的不同地方，因此每次操作都需要所有硬盘来参与。所以，对于随机存取的场景下，这种模式的性能是很差的。对于特别长的顺序读写是非常合适的，比如视频监控数据。