本内容是《基本指南》的一部分: 硬盘与闪存:世纪之战?
评估 权衡你正在考虑的技术、产品和项目的利弊。

防止硬盘故障的最佳方法是什么?

硬盘故障可能会使字节数据处于危险之中。多副本镜像或擦除编码是更有效的数据保护方法吗?

擦除编码和多拷贝镜像是为了应对传统RAID无法保持。。。

随着硬盘驱动器(HDD)密度的提高。尽管硬盘的面积密度有所增加,但它们并没有提高误比特率或每个盘片的磁头数。不可恢复位错误的概率增加,增加了HDD故障和后续RAID组数据丢失的可能性。每GB速度的降低会增加HDD重建时间,同时也会增加并发HDD故障和RAID组数据丢失的风险窗口。

RAID 6RAID 60和RAID 6三重奇偶校验在一定程度上有所帮助;然而,长时间的硬盘重建时间以及硬盘故障导致的肾上腺素心脏病发作导致的训练迫切需要一种可靠的替代方案。这一点变得越来越明显——尤其是对于必须保留数年甚至数十年的近线数据而言,如果数据丢失,就无法重新创建。

多副本镜像通过在不同存储控制器(通常称为)后面的不同hdd上制作数据的多个副本来解决这个问题节点).当硬盘出现故障或硬盘出现不可恢复的位错时,数据的良好拷贝被简单地复制到另一个驱动器。可容忍的HDD或节点并发故障的数量决定了副本的数量:2个并发故障需要2个副本的数据,3个并发故障需要3个副本的数据。从另一个好的副本中复制数据是一种非常快速的数据保护和恢复选项,但成本非常高。数据的每一个副本都会消耗额外的存储容量,这些容量加起来很快。

设计了擦除编码更高效,因为它将数据分成块。总块数称为宽度,而读取整个数据报所需的块数称为宽度. 每个数据块都有部分数据或数据的表示(如公式)以及关于整个数据报的元数据信息。擦除码的公共宽度与宽度比为16:10,这意味着一旦读取前10个数据块,就会重新创建整个数据报。如果缺少任何数据块(最多六个),将重新创建这些数据块并将其写入其他HDD和/或节点。

擦除编码也比多拷贝镜像经济得多。16:10示例最多可防止六个并发HDD或节点失败不会丢失一个字节的数据。这样做只需要比多副本镜像所需的600%多60%的存储空间。如果宽度与宽度的比率为26:20,所消耗的额外存储仅为30%,并且仍然可以防止多达6个并发HDD或节点故障。分块的缺点是增加了相当大的处理开销,减慢写入和读取速度.这使得擦除编码主要用于辅助数据或近线存储,如公共和私有云对象存储。

下一步

擦除编码提供驱动器级保护

三种使用方法防止多个驱动器故障的RAID

擦除编码的利弊vs.RAID

视频:探索RAID和擦除代码的数据保护

深入挖掘数据存储管理

搜寻灾难复苏
搜寻数据备份
搜寻汇聚基础设施
接近
Baidu