raid中xor算法_RAID 6是什么比RAID 5好在哪里

1. 什么叫RAID写惩罚不同RAID要如何计算

RAID 0（Striped Disk Array without Fault Tolerance）
RAID 0是把所有的硬盘并联起来成为一个大的硬盘组。其容量为所有属于这个组的硬盘的总和。所有数据的存取均以并行分割方式进行。由于所有存取的数据均以平衡方式存取到整组硬盘里，存取的速度非常快。越是多硬盘数量的RAID 0阵列其存取的速度就越快。容量效率方面也是所有RAID格式中最高的，达到100%。但RAID 0有一个致命的缺点–就是它跟普通硬盘一样没有一点的冗余能力。一旦有一个硬盘失效时，所有的数据将尽失。没法重组回来！一般来讲，RAID 0只用于一些已有原数据载体的多媒体文件的高速读取环境。如视频点播系统的数据共享部分等。RAID 0只需要两个或以上的硬盘便能组成。

RAID 1（Mirroring）
RAID 1是硬盘镜像备份操作。由两个硬盘所组成。其中一个是主硬盘而另外一个是镜像硬盘。主硬盘的数据会不停的被镜像到另外一个镜像硬盘上。由于所有主硬盘的数据会不停地镜像到另外一个硬盘上，故RAID 1具有很高的冗余能力。达到最高的100%。可是正由于这个镜像做法不是以算法操作，故它的容量效率非常的低，只有50%。RAID 1只支持两个硬盘操作。容量非常有限，故一般只用于操作系统中。

RAID 0+1（Mirroring and Striping）
RAID 0+1即由两组RAID 0的硬盘作RAID 1的镜像容错。虽然RAID 0+1具备有RAID 1的容错能力和RAID 0的容量性能。但RAID 0+1的容量效率还是与RAID 1一样只有50%，故同样地没有被普及使用。

RAID 3（Striping with dedicated parity）
RAID 3在安全方面以奇偶校验（parity check）做错误校正及检测，只需要一个额外的校检磁盘（parity disk）。奇偶校验值的计算是以各个磁盘的相对应位作XOR的逻辑运算，然后将结果写入奇偶校验磁盘，任何数据的修改都要做奇偶校验计算。如某一磁盘故障，换上新的磁盘后，整个磁盘阵列（包括奇偶校验磁盘）需重新计算一次，将故障磁盘的数据恢复并写入新磁盘中，如奇偶校验磁盘故障，则重新计算奇偶校验值，以达容错的要求。

RAID 5（Striping with distributed parity）
RAID 5也是一种具容错能力的RAID 操作方式，但与RAID 3不一样的是RAID 5的容错方式不应用专用容错硬盘，容错信息是平均的分布到所有硬盘上。当阵列中有一个硬盘失效，磁盘阵列可以从其他的几个硬盘的对应数据中算出已掉失的数据。由于我们需要保证失去的信息可以从另外的几个硬盘中算出来，我们就需要在一定容量的基础上多用一个硬盘以保证其他的成员硬盘可以无误地重组失去的数据。其总容量为(N-1)x最低容量硬盘的容量。从容量效率来讲，RAID 5同样地消耗了一个硬盘的容量，当有一个硬盘失效时，失效硬盘的数据可以从其他硬盘的容错信息中重建出来，但如果有两个硬盘同时失效的话，所有数据将尽失。

2. RAID 6的校验位方法

与RAID 5相比，RAID 6增加了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法，数据的可靠性非常高，即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间，相对于RAID 5有更大的“写损失”，因此“写性能”非常差。较差的性能和复杂的实施方式使得RAID 6很少得到实际应用。
常见的RAID6组建类型 RAID 6(6D + 2P)
1 RAID 6(6D + 2P)原理
和RAID 5相似，RAID 6(6D + 2P)根据条带化的数据生成校验信息，条带化数据和校验数据一起分散存储到RAID组的各个磁盘上。在图1中，D0，D1，D2，D3，D4和D5是条带化的数据，P代表校验数据，Q是第二份校验数据。
RAID 6校验数据生成公式(P和Q):
P的生成用了异或
P = A0 XOR B0 XOR C0 XOR D0 XOR E0 XOR F0
A、B、C、D、E、F代表raid6中6块硬盘，A0、B0、C0、D0、E0、F0代表6块硬盘的第一个strip
Q的生成用了系数和异或，假设生成硬盘D的Q校验
QA = A0*D0 XOR A1*D1 XOR A2*D2 XOR A3*D3 XOR A4*D4 XOR A5*D5.....XOR An*Dn
D0～Dn:单个硬盘的所有条带化数据
A0～An:系数
XOR:异或
*：乘
硬盘D的Q校验数据不会存放在硬盘D中，而是存放在其他硬盘中
Q校验数据的计算只需要使用刚刚写入的strip数据Dn*An再XOR这次写入以前的Qn-1即可。
在RAID 6中，当有1块磁盘出故障的时候，利用公式1恢复数据，这个过程是和RAID 5一样的。而当有2块磁盘同时出故障的时候，就需要同时用公式1和公式2来恢复数据了。
各系数A0～A5是线性无关的系数，在D0，D1，D2，D3，D4，D5，P，Q中有两个未知数的情况下，也可以联列求解两个方程得出两个未知数的值。这样在一个RAID组中有两块磁盘同时坏的情况下，也可以恢复数据。上面描述的是校验数据生成的算法。其实RAID 6的核心就是有两份检验数据，以保证两块磁盘同时出故障的时候，也能保障数据的安全。
假设一共6块硬盘，使用4块创建逻辑盘，raid6,4个硬盘在使用时都被先条带化，然后分别存储数据和校验位。
如果一块硬盘出现物理故障，RAID的会处于降级状态，但是仍然有容错功能；
如果第二块硬盘出现故障，逻辑盘中还剩下的两块硬盘就不再有容错功能。
如果阵列中有热备硬盘，出故障的硬盘上的数据会转移到热备硬盘上，并且自动进行重建，数据的条带化存储方式和原来的两块硬盘相同。

3. 什么是raid card,能否用深入浅出的说一下.

参考一下，平时我们主要用raid5级就够了
(一句话就是把多个硬盘当成一块硬盘来用）

主要级别
主要包含RAID 0～RAID 7等数个规范，它们的侧重点各不相同，常见的规范有如下几种：
RAID 0：无差错控制的带区组
要实现RAID0必须要有两个以上硬盘驱动器，RAID0实现了带区组，数据并不是保存在一个硬盘上，而是分成数据块保存在不同驱动器上。因为将数据分布在不同驱动器上，所以数据吞吐率大大提高，驱动器的负载也比较平衡。如果刚好所需要的数据在不同的驱动器上效率最好。它不需要计算校验码，实现容易。它的缺点是它没有数据差错控制，如果一个驱动器中的数据发生错误，即使其它盘上的数据正确也无济于事了。不应该将它用于对数据稳定性要求高的场合。如果用户进行图象（包括动画）编辑和其它要求传输比较大的场合使用RAID0比较合适。同时，RAID可以提高数据传输速率，比如所需读取的文件分布在两个硬盘上，这两个硬盘可以同时读取。那么原来读取同样文件的时间被缩短为1/2。在所有的级别中，RAID 0的速度是最快的。但是RAID 0没有冗余功能的，如果一个磁盘（物理）损坏，则所有的数据都无法使用。
RAID 1：镜象结构
raid1
对于使用这种RAID1结构的设备来说，RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。通过下面的结构图您也可以看到必须有两个驱动器。因为是镜象结构在一组盘出现问题时，可以使用镜象，提高系统的容错能力。它比较容易设计和实现。每读一次盘只能读出一块数据，也就是说数据块传送速率与单独的盘的读取速率相同。因为RAID1的校验十分完备，因此对系统的处理能力有很大的影响，通常的RAID功能由软件实现，而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。当您的系统需要极高的可靠性时，如进行数据统计，那么使用RAID1比较合适。而且RAID1技术支持“热替换”，即不断电的情况下对故障磁盘进行更换，更换完毕只要从镜像盘上恢复数据即可。当主硬盘损坏时，镜像硬盘就可以代替主硬盘工作。镜像硬盘相当于一个备份盘，可想而知，这种硬盘模式的安全性是非常高的，RAID 1的数据安全性在所有的RAID级别上来说是最好的。但是其磁盘的利用率却只有50%，是所有RAID级别中最低的。
RAID2：带海明码校验
从概念上讲，RAID 2同RAID 3类似，两者都是将数据条块化分布于不同的硬盘上，条块单位为位或字
节。然而RAID 2 使用一定的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息，使得RAID 2技术实施更复杂。因此，在商业环境中很少使用。下图右边的各个磁盘上是数据的各个位，由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上，具体情况请见下图。由于海明码的特点，它可以在数据发生错误的情况下将错误校正，以保证输出的正确。它的数据传送速率相当高，如果希望达到比较理想的速度，那最好提高保存校验码ECC码的硬盘，对于控制器的设计来说，它又比RAID3，4或5要简单。没有免费的午餐，这里也一样，要利用海明码，必须要付出数据冗余的代价。输出数据的速率与驱动器组中速度最慢的相等。
RAID3：带奇偶校验码的并行传送
raid3
这种校验码与RAID2不同，只能查错不能纠错。它访问数据时一次处理一个带区，这样可以提高读取和写入速度,它像RAID 0一样以并行的方式来存放数据，但速度没有RAID 0快。校验码在写入数据时产生并保存在另一个磁盘上。需要实现时用户必须要有三个以上的驱动器，写入速率与读出速率都很高，因为校验位比较少，因此计算时间相对而言比较少。用软件实现RAID控制将是十分困难的，控制器的实现也不是很容易。它主要用于图形（包括动画）等要求吞吐率比较高的场合。不同于RAID 2，RAID 3使用单块磁盘存放奇偶校验信息。如果一块磁盘失效，奇偶盘及其他数据盘可以重新产生数据。如果奇偶盘失效，则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率，但对于随机数据，奇偶盘会成为写操作的瓶颈。利用单独的校验盘来保护数据虽然没有镜像的安全性高，但是硬盘利用率得到了很大的提高，为（n-1）/n。
RAID4：带奇偶校验码的独立磁盘结构
raid4
RAID4和RAID3很像，不同的是，它对数据的访问是按数据块进行的，也就是按磁盘进行的，每次是一个盘。在图上可以这么看，RAID3是一次一横条，而RAID4一次一竖条。它的特点和RAID3也挺像，不过在失败恢复时，它的难度可要比RAID3大得多了，控制器的设计难度也要大许多，而且访问数据的效率不怎么好。
RAID5：分布式奇偶校验的独立磁盘结构
RAID5清晰图片
从它的示意图上可以看到，它的奇偶校验码存在于所有磁盘上，其中的p0代表第0带区的奇偶校验值，其它的意思也相同。RAID5的读出效率很高，写入效率一般，块式的集体访问效率不错。因为奇偶校验码在不同的磁盘上，所以提高了可靠性，允许单个磁盘出错。RAID 5也是以数据的校验位来保证数据的安全，但它不是以单独硬盘来存放数据的校验位，而是将数据段的校验位交互存放于各个硬盘上。这样，任何一个硬盘损坏，都可以根据其它硬盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。但是它对数据传输的并行性解决不好，而且控制器的设计也相当困难。RAID 3 与RAID 5相比，重要的区别在于RAID 3每进行一次数据传输，需涉及到所有的阵列盘。而对于RAID 5来说，大部分数据传输只对一块磁盘操作，可进行并行操作。在RAID 5中有“写损失”，即每一次写操作，将产生四个实际的读/写操作，其中两次读旧的数据及奇偶信息，两次写新的数据及奇偶信息。RAID-5的话，优点是提供了冗余性（支持一块盘掉线后仍然正常运行），磁盘空间利用率较高（N-1/N），读写速度较快（N-1倍）。RAID5最大的好处是在一块盘掉线的情况下，RAID照常工作，相对于RAID0必须每一块盘都正常才可以正常工作的状况容错性能好多了。因此RAID5是RAID级别中最常见的一个类型。RAID5校验位即P位是通过其它条带数据做异或(xor)求得的。计算公式为P=D0xorD1xorD2…xorDn，其中p代表校验块，Dn代表相应的数据块，xor是数学运算符号异或。 RAID5校验位算法详解 P=D1 xor D2 xor D3 … xor Dn （D1,D2,D3 …Dn为数据块，P为校验，xor为异或运算） XOR(Exclusive OR)的校验原理如下表： A值 B值 Xor结果
0 0 0
1 0 1
0 1 1
1 1 0
这里的A与B值就代表了两个位，从中可以发现，A与B一样时，XOR(非或又称"非异或")结果为0，A与B不一样时，XOR结果就是1，如果知道XOR结果，A和B中的任何两个数值，就可以反推出剩下的一个数值。比如A为1，XOR结果为1，那么B肯定为0，如果XOR结果为0，那么B肯定为1。这就是XOR编码与校验的基本原理。
RAID6：两种存储的奇偶校验码的磁盘结构
raid6
名字很长，但是如果看到图，大家立刻会明白是为什么，请注意p0代表第0带区的奇偶校验值，而pA代表数据块A的奇偶校验值。它是对RAID5的扩展，主要是用于要求数据绝对不能出错的场合。当然了，由于引入了第二种奇偶校验值，所以需要N+2个磁盘，同时对控制器的设计变得十分复杂，写入速度也不好，用于计算奇偶校验值和验证数据正确性所花费的时间比较多，造成了不必须的负载。我想除了军队没有人用得起这种东西。常见的RAID6组建类型RAID 6(6D + 2P) 1 RAID 6(6D + 2P)原理和RAID 5相似，RAID 6(6D + 2P)根据条带化的数据生成校验信息，条带化数据和校验数据一起分散存储到RAID组的各个磁盘上。在图1中，D0，D1，D2，D3，D4和D5是条带化的数据，P代表校验数据，Q是第二份校验数据。 RAID 6(6D + 2P)根据条带化的数据生成校验信息，条带化数据和校验数据一起分散存储到RAID组的各个磁盘上 RAID 6校验数据生成公式(P和Q): P的生成用了异或 P = D0 XOR D1 XOR D2 XOR D3 XOR D4 XOR D5 Q的生成用了系数和异或 Q = A0*D0 XOR A1*D1 XOR A2*D2 XOR A3*D3 XOR A4*D4 XOR A5*D5 D0～D5:条带化数据 A0～A5:系数 XOR:异或 *:乘在RAID 6中，当有1块磁盘出故障的时候，利用公式1恢复数据，这个过程是和RAID 5一样的。而当有2块磁盘同时出故障的时候，就需要同时用公式1和公式2来恢复数据了。各系数A0～A5是线性无关的系数，在D0，D1，D2，D3，D4，D5，P，Q中有两个未知数的情况下，也可以联列求解两个方程得出两个未知数的值。这样在一个RAID组中有两块磁盘同时坏的情况下，也可以恢复数据。上面描述的是校验数据生成的算法。其实RAID 6的核心就是有两份检验数据，以保证两块磁盘同时出故障的时候，也能保障数据的安全。
RAID7：优化的高速数据传送磁盘结构
RAID7所有的I/O传送均是同步进行的，可以分别控制，这样提高了系统的并行性，提高系统访问数据的速度；每个磁盘都带有高速缓冲存储器，实时操作系统可以使用任何实时操作芯片，达到不同实时系统的需要。允许使用SNMP协议进行管理和监视，可以对校验区指定独立的传送信道以提高效率。可以连接多台主机，因为加入高速缓冲存储器，当多用户访问系统时，访问时间几乎接近于0。由于采用并行结构，因此数据访问效率大大提高。需要注意的是它引入了一个高速缓冲存储器，这有利有弊，因为一旦系统断电，在高速缓冲存储器内的数据就会全部丢失，因此需要和UPS一起工作。当然了，这么快的东西，价格也非常昂贵。
RAID10/01：高可靠性与高效磁盘结构
这种结构无非是一个带区结构加一个镜象结构，因为两种结构各有优缺点，因此可以相互补充，达到既高效又高速还可以互为镜像的目的。大家可以结合两种结构的优点和缺点来理解这种新结构。这种新结构的价格高，可扩充性不好。主要用于容量不大，但要求速度和差错控制的数据库中。其中可分为两种组合：RAID10和RAID01 RAID 10是先镜射再分区数据。是将所有硬盘分为两组，视为是RAID 0的最低组合，然后将这两组各自视为RAID 1运作。RAID 10有着不错的读取速度，而且拥有比RAID 0更高的数据保护性。 RAID 01则是跟RAID 10的程序相反，是先分区再将数据镜射到两组硬盘。它将所有的硬盘分为两组，变成RAID 1的最低组合，而将两组硬盘各自视为RAID 0运作。RAID 01比起RAID 10有着更快的读写速度，不过也多了一些会让整个硬盘组停止运转的机率；因为只要同一组的硬盘全部损毁，RAID 01就会停止运作，而RAID 10则可以在牺牲RAID 0的优势下正常运作。 RAID 10巧妙的利用了RAID 0的速度以及RAID 1的保护两种特性，不过它的缺点是需要的硬盘数较多，因为至少必须拥有四个以上的偶数硬盘才能使用。
RAID 50：被称为分布奇偶位阵列条带
同RAID 10相仿的，它具有RAID 5和RAID 0的共同特性。它由两组RAID 5磁盘组成（每组最少3个），每一组都使用了分布式奇偶位，而两组硬盘再组建成RAID 0，实验跨磁盘抽取数据。RAID 50提供可靠的数据存储和优秀的整体性能，并支持更大的卷尺寸。即使两个物理磁盘发生故障（每个阵列中一个），数据也可以顺利恢复过来。 RAID 50最少需要6个驱动器，它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序。
RAID 53：称为高效数据传送磁盘结构
结构的实施同Level 0数据条阵列，其中，每一段都是一个RAID 3阵列。它的冗余与容错能力同RAID 3。这对需要具有高数据传输率的RAID 3配置的系统有益，但是它价格昂贵、效率偏低。
RAID 1.5：一个新生的磁盘阵列方式
它具有RAID 0+1的特性，而不同的是，它的实现只需要2个硬盘。从表面上来看，组建RAID 1.5后的磁盘，两个都具有相同的数据。当然，RAID 1.5也是一种不能完全利用磁盘空间的磁盘阵列模式，因此，两个80GB的硬盘在组建RAID 1.5后，和RAID 1是一样的，即只有80GB的实际使用空间，另外80GB是它的备份数据。如果把两个硬盘分开，分别把他们运行在原系统，也是畅通无阻的。但通过实际应用，我们发现如果两个硬盘在分开运行后，其数据的轻微改变都会引起再次重组后的磁盘阵列，没法实现完全的数据恢复，而是以数据较少的磁盘为准。

4. RAID 6是什么比RAID 5好在哪里

RAID 6采用双重校验，比RAID 5多一重，在一个RAID组中需要两台硬盘驱动器的容量来保存校验数据，因此能够在两台硬盘同时故障的情况下保证数据不丢失，但是性能也会受到比较明显的影响。

很多种算法都可以实现RAID 6，其中就有一种在横向和斜向两个方向上进行XOR（异或）运算的Dual-XOR算法，横向当然是与RAID 5一样了，区别在于斜向，所以也被称为“对角线算法”。它的校验数据生成过程相对简单，但在两台硬盘驱动器掉线的时候，只能支持逐个数据块的恢复，而且不同条带之间还要一起参与计算（斜向嘛）。这种做法在分布式校验的环境中很是麻烦，却很适合独立校验的口味，于是成为了RAID-DP的基础。

真正被广为接受的还是基于P+Q的RAID 6算法。这个P么，就是RAID 5的那个P（Parity），也即同一条带中全部原始数据（当然不包括Q）的XOR运算结果。至于多出来的Q，则是同一条带中其他数据（包括P）进行伽罗华域（Galois Field，简称GF，有限域）乘法运算的结果。

P+Q算法的优势在于恢复数据相对简单。在一台硬盘驱动器掉线时，丢掉原始数据或P内容的条带，与RAID 5一样利用XOR恢复数据；丢掉Q域的条带，利用GF变换的逆运算恢复数据。而如果有两台硬盘驱动器掉线，就需要同时使用XOR和GF变换来恢复数据了。

然而，无论采用哪种算法，RAID 6都比RAID 5需要更多的计算资源。如果I/O处理器（IOP）没有对此进行专门的优化，性能下降显然是不可避免的。

可参考下文：http://www.stor-age.com/stor-age/2007/1218/686517.shtml

5. 为什么RAID5至少需要三块硬盘

RAID5的存储机制是两块存数据，一块存另外两块硬盘的交易校验结果，就好像最简单的数学题，1+2=3，当你少了其中任何一个数时，就可以通过逆推，找到第三个数。RAID5的建立后，坏掉一块硬盘，可以通过另外两块硬盘的数据算出第三块的，所以至少要3块。
第一RAID5 是用XOR效验来作的 1+2＝3 如果少了其中一位数等式能成立吗其中1 和 2 是数据 3就是效验码 + 号是计算格式如果其中2 那个数据丢失了阵列卡可以通过 3-1=2 “计算出2”的那个数据所以当RAID 5其中一个硬盘出问题了系统虽然可以运行但速度会很慢。

拓展资料

RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案。 RAID 5可以理解为是RAID 0和RAID 1的折中方案。RAID 5可以为系统提供数据安全保障，但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度，只是多了一个奇偶校验信息，写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息，RAID 5的磁盘空间利用率要比RAID 1高，存储成本相对较低，是目前运用较多的一种解决方案。

6. raid 5 是如何计算出奇偶校验信息所需占用的空间大小的

1，你这样理解进入误区了

2，知识准备，raid5的工作模式；

假设一组数据是010

那么这组数据的校验码是0+1+0+=1（假定此控制器采用XOR运算来检验）

在假定你再用4快盘做raid5，那么控制器会把“0，1，0，1”这4个数据分别写到硬盘内，这样在无数个这样的过程中，第4块盘上的空间因为要记录校验数据被浪费掉了，

3，假设是5快盘那么如图所示

如果还是困难，请给我邮箱我会把一份清晰的文档发给你。

导航:首页 > 源码编译 > raid中xor算法

raid中xor算法

拓展资料

与raid中xor算法相关的资料