开始

维基邦CTO:擦除编码可以帮助降低数据备份成本

维基邦首席技术官表示，与传统方法相比，擦除编码可以帮助减少备份所需的数据，并降低备份和恢复的成本。

通过

卡罗尔Sliwa

发表:2013年9月26日

一位行业分析师表示，与目前许多IT公司支付的费用相比，擦除编码可以帮助减少备份所需的数据量，并大幅降低备份和恢复成本。

大卫·弗洛佩，维基联合创始人和首席技术官，是一家位于Marlborough，Marlborough的社区的研究和分析公司，称该公司做了一个详细研究在这一点传统备份形式的成本与一种将制造的新方法相比，恢复使用擦除编码．

Floyer说，与包含擦除编码的系统一起使用的单一分散副本“将比最佳的、三数据中心的、基于数组的同步拓扑更容易访问和更可靠”。在同样的水平下，它的价格也会“便宜9到25倍”恢复点目标和恢复时间目标(RPO和RTO)，他说。

“因此，通过将擦除编码与其他技术(如快照)相结合，重复数据删除，压缩数据，“Floyer表示，”备份成本大大降低，实际上可以实现更高的可用性和更高的可恢复性。“

在这个播客TechTarget的资深作者Carol Sliwa采访时,弗洛伊也分享他的观点在擦除编码的优缺点,擦除编码的数据量是有意义的,决策点的擦除编码,和长期使用的技术潜力。

下载这个播客

你认为擦除编码的主要优点和缺点是什么?

大卫·弗洛耶:主要的好处是灵活性。你可以非常非常容易地选择保护级别，你可以调高或调低。例如，如果你有16个数据切片，而你想添加4个切片(使用擦除编码)，那就是远更有效的方式做到它比传统的突袭格式。这会给你带来更多好处。您可以丢失4个切片，但仍然可以恢复数据——您可以丢失任意4个切片。它更有效率，也更灵活。

主要的擦除编码的缺点你提供的保护越多，解码它的开销就越高。你得把所有的切片都拿进来，然后处理它们，有很多的处理过程。因此，一般来说，读速率越高，实际执行擦除编码所需的运行时间和CPU资源的开销就越大。

擦除编码可以消除备份的需要吗?

弗洛耶:这并没有取消备份的要求。它所做的是帮助减少备份所需的数据量，并允许新的备份模型，以及将数据用于不止备份——例如，将其用于备份和归档。

如果你考虑备份，你有两个主要因素:RPO恢复点目标；这是灾难发生时你会丢失的数据量;如果你有一个RTO，那么你多快能把备份系统准备好?第二个方面有一定程度的可靠性。很明显，您有可能同时失去主副本和副副本。例如，如果你看看银行是如何管理的，他们通常至少有一个三个系统的副本。在他们的电子邮件系统中，有一家大型银行有四份数据副本，所以在任何时候，他们都可以故障转移到四份副本中的任何一份。因此，你可以看到人们对高可用性、高RTO和高RPO的要求越来越高。

擦除编码如此重要的原因是，如果你能将数据分散到多个位置或在一个位置内，你的冗余水平就会高得多。你需要传输的数据量大大减少了。如果你把它和其他技术结合起来，比如快照和重复数据删除和压缩，您可以到达您可以非常缩短数据的环境，即您在网络上发送并获得非常高的可用性，降低成本。

我们对高可用性备用的擦除编码进行了估计，您可以将其余10次的某处降低总体成本。[它会]一十分之一，做传统副本的成本，备份，在磁带或实时取出它。所以，[会有]成本非常显着减少。

但您仍然需要备份，因为您需要那个时间点。您需要从日志恢复，只是在软件错误的情况下。你需要持续的数据传输才能快速恢复。因此，我们不会在短时间内消除备份，但擦除编码将是备份解决方案的一部分，并大大降低成本。

IT商店应考虑擦除编码的数据最小阈值是多少？

弗洛耶:如果你的数据小于1拍字节，那么你现在从擦除编码中得到的节省是很小的。你也可以用RAID 6．你得藏在被子里。但在目前，引入一个擦除编码系统并没有太多商业意义。

如果你看看主要的存储使用擦除编码的云提供商，它们是，例如，非常大的照片网站或非常大的音频网站，您有大量数据的站点，在它使用时，它在某种缓存中，但是它处于存档模式。您希望通过能够在不同的位置传播来使其安全。您希望能够恢复它，但不需要即时反应。如果它在一分钟后回来，那很好。

终端用户如何决定要做多少擦除编码?

Floyer:我认为这将在应用程序设计或应用程序实现阶段出现。当您部署它时，您将放入一组适合该特定应用程序的存储。如果您将应用程序作为迁移的一部分移动到另一组存储，那么您可能会考虑对其进行更改以将其考虑在内。但改变的开销太高，可能不太可能。

所以，看它的最佳方式是：通过这个新的应用程序，我可以使用从我实施的这个特定的软件中使用擦除编码了吗？如果它确实如此，那么你就做出了决定。我认为这是回顾性地添加它，这可能是稍后在五年的时间内适当的，但目前这不是想到它的方式。如果您有一个新的应用程序，您应该让档案供应商成为为您进行解决的人，它是否以正确的方式设置，并允许您利用该擦除编码。它是ISVS [独立软件供应商]一般谁将推动它，因为它会降低硬件的成本，在价值环境中，它们将能够对自己提取更多的值，而不是用户花在硬件上。

您对企业IT部门在短期和长期内如何使用RAID 5或RAID 6之外的擦除代码有什么看法?

弗洛耶:短期内，擦除编码将会出现在磁盘侧作为替代方案，对存储管理组织提供更大的灵活性，以确定保护和成本之间的平衡。所以，这显然会发生。它已经发生了，它会发生在未来几年。

我认为，长期愿景更加清楚：擦除编码将会隐藏起来。随着闪光变得更普遍，大量的闪光是擦除编码。闪存技术本质上很脏。这是很多错误，它使用许多方向编码擦除，以便保持对数据本身的信心。所以，它将占据一部分技术。

一个非常有趣的思想实验是：例如，在哪里，例如，全闪存阵列？所有企业存储都可以在全闪存阵列上吗？如果你想到它，你应该能做什么是分开的IOPS或带宽，即从存储器本身读取或写入数据的访问。如果你在写数据或读数据，那么闪存就会有一定程度的退化。所以，你想要的是能够根据它是否被写入了很多或者它是否只是停留在那里没有任何访问来改变存储的保护程度。

最明显的答案就是改变擦除编码。所以，我们期望看到的是全闪存数组可能有不止一种类型的数组你使用擦除编码来提供一种类型的分层无需移动数据。这非常重要。一旦你开始移动数据，特别是使用flash，你就会造成磨损。因此，这种将磨损作为参数之一的方式可能是一种非常有趣的方式，可以降低闪存的成本，这样你就可以将它用于企业存储的每个部分。这是一个长期的愿景。它要到五年左右才会实现。但我认为这是一个非常有趣的，擦除编码将会实现的。

维基邦CTO:擦除编码可以帮助降低数据备份成本

维基邦首席技术官表示，与传统方法相比，擦除编码可以帮助减少备份所需的数据，并降低备份和恢复的成本。

深入挖掘数据中心存储

RAID, flash和擦除编码:什么在固态状态下工作得最好?

StorOne存储系统增强数据保护能力

Erasure coding vs RAID:云时代的数据保护

问答：SWIFTSTACK对象存储区域IN AI，ML，分析