克里斯- Fotolia

评估 权衡你正在考虑的技术、产品和项目的利弊。

为什么对象存储正在成为RAID的替代方案

RAID是一种成熟的存储技术,以可靠和安全著称。但随着数据量的增长,更灵活、更有效的RAID替代方案正在获得支持。

多年来,企业一直在寻求RAID的支持,因为它已经被证明是存储企业数据的有效和可靠的工具。RAID利用了块存储和先进的数据技术的好处,以提高关键工作负载的性能,同时防止数据丢失和损坏。

但是RAID有一个问题:由于今天的数据量很大,重建失败的驱动器所需的时间比RAID刚出现时要长得多。需要存储的数据越多,RAID的效率就越低,数据面临的风险也就越大。因此,许多组织正在寻找RAID的替代方案。对象存储正成为一种流行的选择,因为它可以更容易、更便宜地处理大量数据。作为对象存储的成熟并变得更广泛实施,人们可能会想知道是否raid - 而且,通过扩展,块存储 - 在企业中都有未来。

了解raid

RAID是一种验证和真实的存储技术,可以最大限度地提高性能,并提供如果物理驱动器失败或数据变得损坏,则提供恢复数据的方法。RAID将数组的物理磁盘一起分组,并将其作为单个逻辑驱动器。存储数据的过程依赖于三种导入技术:条带化,镜像和奇偶校验,通常在一些彼此组合中。

条带化将数据均匀地分割到多个驱动器上,以平衡工作负载并提高性能。镜像将相同的数据同时写入两个或多个硬盘,实现冗余。奇偶校验验证数据在传输过程中是否丢失或覆盖,以支持容错和数据校正。

RAID实现是根据它们的级别进行分类的。例如,RAID 0在多个硬盘上分条数据,但不提供镜像或奇偶校验。RAID 1镜像数据而不提供奇偶校验或条带化,而RAID 5——最常见的RAID实现——使用条带化和奇偶校验,但不镜像。还可以组合RAID级别,例如RAID 10 (RAID 1 + 0),使用RAID 1和RAID 0来提供性能和数据保护。

使用RAID,服务器有更多的主轴用于写入和读取数据,这使得实现比使用单个驱动器更快的吞吐量成为可能。同时,额外的驱动器可以通过奇偶校验或镜像提高可用性和弹性。

尽管RAID在数据中心中扮演着重要的角色,但它并不是为今天的存储卷而设计的。当阵列中的某个磁盘发生故障时,数据会一直处于脆弱状态,直到可以更换该磁盘为止。根据数据量的不同,更换磁盘有时需要几天的时间。在此期间,另一个磁盘可能会出现故障,或发现包含坏扇区或不可读的数据——数据量越大,丢失数据的风险就越大。

由于这个原因,擦除编码正成为RAID的常见替代方案。擦除编码将数据分解为可扩展的片段,并使用冗余的数据片段进行编码。与RAID相比,擦除编码可以减少重构数据所需的时间和开销。

一般行业趋势也在远离RAID的境内发挥作用。例如,超奇计算使用冗余服务器来保护数据,SSD合并诸如佩戴调平和纠错码之类的功能,以及一些SSD供应商现在添加了自己的数据保护功能,例如NetApp的Helix,这是一种分布式复制算法固态全闪阵列。

当然,还有对象存储,它改变了数据存储的性质。

RAID的存储积木

然而,向对象存储的转移不仅与RAID有关,还与块存储有关,块存储是构建RAID的数据架构。块存储中断文件每个数据块都有一个唯一的地址。较小的数据结构使存储管理系统能够以最有效的方式存储数据块。

服务器访问存储块时,需要使用通信协议,如fc、fc over Ethernet或iSCSI等。块本身不包含元数据。由存储管理系统决定如何分配存储空间以及将数据存储在何处。

块存储主要用于SAN配置,通常包括RAID阵列。块存储是一种被广泛实现和理解的技术,非常适合需要高吞吐量和低延迟的应用程序。块存储解决了文件存储的许多限制,文件存储是一种更基本的存储技术,使用元数据和目录来组织文件。然而,尽管文件存储简单且易于部署,但它的分层性质增加了开销,随着包含更多的文件和目录,开销将继续增加。

块存储更灵活执行比文件存储更好,但它的实现和维护也更加复杂和昂贵——RAID实现会加剧这些问题。此外,块存储不包含元数据,这意味着它不能被搜索或用于某些高级分析类型。块存储也不能扩展到满足更大数据量的需求。另外,随着存储和应用程序之间距离的增加,系统的延迟也会增加。

尽管有这些限制,需要快速I / O的应用程序继续依赖块存储。例如,数据库管理系统通常使用块存储来支持他们的事务工作负载,而电子邮件服务器和虚拟化软件通常依赖于块存储以满足其波动的工作负载。毫不奇怪,这些系统通常利用RAID提升性能和保护数据。

输入对象存储

对象存储将数据存储与块存储相差多样化。而不是将文件划分为原始块,对象存储将它们和它们的元数据放在一起,以及可定制的扩展元数据,以满足应用程序的需求。数据和元数据被存储为共享公共地址空间(存储池)的单个对象,而不需要导航卷或文件层次结构。

对象存储为RAID和块存储提供了一种更简单、更灵活的替代方案。

每个对象在创建时都会被分配一个唯一的ID。该对象可以存储在本地服务器或位于地球另一端的基于云的数据中心。想要访问对象的应用程序只需要提供对象的ID,而不管其位置如何。应用程序通过基于http的REST API使用基本调用(如GET、PUT或DELETE)与对象连接。

当使用擦除编码作为数据保护时,对象存储提供了比RAID和块存储更简单、更灵活的替代方案。分布式数据池使得存储跨越地理边界的大量非结构化数据成为可能。对象可以被复制到多个驱动器,驱动器可以在需要的时候和地点添加。扩展对象存储仅仅是向存储集群中添加节点,无论节点位于何处,都可以提供无限的可伸缩性。

对象存储还具有包括数据和元数据的优点。元数据可以使用特定于应用程序的属性进行自定义,导致比通过块存储可以实现的更高级,大规模的分析。对象存储也是RAID和块存储的更具成本效益的替代方案,传统上实现和维护昂贵。

因为对象存储中的对象共享一个公共的地址空间,没有块存储和RAID带来的复杂性和开销,管理存储也容易得多。此外,对象存储在保护数据不受驱动器故障或数据损坏方面具有优势。对象可以根据需要轻松地复制到尽可能多的辅助系统,而不会引起额外的开销。对象存储也可以使用编码来保护存储的数据,它与突袭较低的开销。

尽管有这些好处,但对象存储并不能解决所有企业工作负载的问题。块存储,无论是否有RAID,在性能方面都占优势,特别是对于需要高度随机访问I/O的应用程序,如数据库和虚拟桌面。对于对象存储,如果一个对象的数据需要更新,则必须重写整个对象,这可能会影响性能,特别是在数据频繁变化的情况下。

包含元数据也可以添加到计算开销,导致额外的延迟。组织还应该意识到从块存储移动到对象存储意味着必须更新其应用程序来通过API访问对象。

对象存储、块存储和RAID

块存储不会很快进入,也不是突袭,也不是SAN。运行关键业务应用程序,金融系统,数据库管理系统,虚拟桌面基础架构和其他高性能应用程序的组织已经在这些系统中广泛投入,并了解他们的工作方式。

他们还明白,他们的数据卷是指数增长的,并且需要考虑新的存储模型。对象存储解决了这些旧技术的许多限制,并且非常适合与数据量更多的情景,而不是具有备份,例如备份,存档和大数据存储。RAID和块存储不能处理此类大规模数据卷,并且对象存储通常更便宜,更易于管理,同时提供更大的灵活性。

对象存储和擦除编码是否最终会导致RAID的崩溃还很难说。虽然它们提供了RAID的替代方案,但RAID的复杂性和局限性可能足以导致它的消亡,而无需对象存储和擦除编码的帮助。即使RAID逐渐被淘汰,块存储和san仍将存在很长一段时间。

对象存储是仍然是一项年轻的技术继续发展和成熟。也许它最终会变得如此表现和可靠,在二十多年来,很少有人甚至会记住块存储 - 更不用说raid。在此之前,组织将不得不平衡两种技术。

深入挖掘对象存储

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu