存储

管理和保护所有企业数据

Gorodenkoff / stock.adobe.com

通过提高存储性能来击败软件瓶颈

找出供应商在解决存储软件瓶颈问题方面所做的工作,以使用户能够在他们的数据中心中提取媒体的全部性能潜力。

存储系统不再充分发挥其潜力。证明这个说法需要一点数学运算。

如果在全闪存阵列中加入每个驱动器的原始性能并将其与该数组的规定性能进行比较,则会发现显着差异。数学建议全闪存系统应该能够生成数百万的IOPS,但大多数不能创造超过几十万。

理解绩效差距的原因需要了解存储系统架构。

最多今天的存储系统由CPU,内存,内部和外部网络,存储介质和存储软件组成。存储软件是数据存储管理器与其配置和保护存储在介质上的数据相互作用。除了软件外,存储生态系统中的每个组件都变得更快,潜伏。例如,CPU现在拥有更多的核心,存储介质是闪存而不是基于硬盘的,网络具有更多带宽。

商家数量的增加软件定义的存储类别驱动了关于将软件与存储生态系统的其他部分隔离开来的讨论。即使是提供“交钥匙”存储产品的供应商,现在也主要是作为软件开发人员,因为他们的软件可能只能与他们销售的硬件配套使用。公平地说,他们的设备可能有一些独特的功能或配置,但是这些供应商仍然在编写软件代码来管理存储环境。

在大多数情况下,存储软件的挑战是剩余的存储软件,与十年前相同。甚至具有大多数存储软件产品和工具提供的功能 - RAID,快照和复制 - 保持相对相同。

对于存储供应商来说,克服软件瓶颈并提高存储性能是一个关键的障碍。如果他们做不到这一点,客户就没有理由采用更快的存储技术。让我们来探讨一下供应商已经做了什么来尝试解决这个问题,因为存储软件阻止用户提取充分表现潜力存储系统内的存储介质。

用硬件解决问题

最常见的是,供应商有抛出更多的CPU和内存在这个问题。但更强大的cpu意味着更昂贵的材料账单,这并不一定能解决问题。

CPU制造商不再通过提高每核的原始性能来增强执行。相反,它们增加了CPU内包含的核心数。但利用具有八个或更多内核的多核处理器需要复杂的软件多线程并且,在大多数情况下,从地上重写代码。为避免这一耗时的过程,存储供应商试图将特定功能隔离到单个核心,这有助于性能,但不会有效地并行使用核心。

另一种方法是增加更多的内存,作为CPU和闪存之间的缓存。再一次,增加内存的成本更高。对于存储系统能够支持的内存大小,也存在物理限制。此外,内存本身是易失的,电源或系统故障将导致数据丢失。围绕易失性存储器的工作增加了复杂性和更高的成本。

我们需要修复存储软件的瓶颈吗?

从存储系统中获得最大性能的挑战使许多供应商将他们的焦点转移到诸如此类的因素中管理的简单性或服务质量的特点.这里的基本立场是,没有必要提高性能,因为当前的系统已经足够好了。

许多数据中心不需要超过500,000 IOPS;事实上,大多数都不需要超过100,000 IOPS。问题是,不充分利用闪存驱动器的原始性能会增加媒体成本。如果从技术上讲,四五个闪存驱动器可以提供50万或更多的IOPS,为什么一个组织要被迫购买24个或更多的IOPS ?

闪存容量的增加使情况更加复杂。在一年之内,16+ TB u盘将是司空见惯的,容量更高的推动力很快。这意味着具有16个TB驱动器的24驱动闪存阵列将提供384 TB的原始容量,而不是大多数数据中心需要。但它仍然是供应商将强迫数据中心购买的金额,因此他们的产品可以提供可接受的表现。

高密度闪光灯的问题

高密度闪光可能更多的是储存系统表现不佳的问题高性能的闪光.一些供应商已经准备好在今年发布16+ TB驱动器,还有一些厂商已经宣布将在明年发布50+ TB驱动器。

按每tb计算,这些驱动器的成本将大大低于今天的闪存驱动器,并且性能几乎相同。虽然数据继续增长,但并不是所有的数据中心都将在未来五年内达到PB级。但如果没有更有效的存储软件模型,供应商可能会强制这些数据中心购买1.2 PB的每架容量(50 TB x 24个驱动器)。

最多可组合存储产品可以对大容量ssd进行切片,以便集群能够更有效地使用它们。“从零开始”的存储软件更加引人注目。如果它可以从驱动器中提取充分表现,这些工具可以使一个中型数据中心解决所有的存储需求12-drive系统,提供超过100万IOPS和600 TB的能力或6驱动系统提供500000 IOPS和300 TB的能力。

还有一个现实是,新的工作负载,比如分析,AI,机器学习和深度学习需要比典型数组提供更多的性能。在这些市场中,对100万IOPS或更多IOPS的需求并不罕见。此外,主流工作负载将继续扩展,并需要更多的性能,因此甚至数据库或虚拟环境在某些时候也将从性能升级中受益。

如何修复软件瓶颈

解决软件瓶颈和提高存储性能需要成为存储供应商的首要任务,否则新的高速媒体和网络的采用率将会很低。特别是刚起步的存储供应商,已经发现了这些挑战,有几种方法可以解决这些挑战。

消除存储系统的概念。目前,大多数工作负载作为环境的一部分进行操作,通常是作为集群的服务器集合——就像虚拟机集群Oracle Real应用集群Hadoop集群.管理这些群集的软件包括卷管理和数据保护等基本存储管理功能。性能提高,因为没有网络或高级存储软件添加延迟。

每个集群独立运行,存储资源利用率低,容易出现问题。存储管理在每个集群中成为一个独立的管理过程,存储利用率通常很低,因为软件不能在整个集群中均匀地分布数据和I/O负载。

数据保护需要在集群内的节点之间复制数据,这将大大增加容量消耗。

使用可组合的跨集群存储。集群存储孤岛问题的一个潜在解决方案是可存储.可组合存储涉及存储生态系统中组件的共享资源池。当集群需要存储资源时,可组合软件为该集群分配虚拟存储系统。

例如,存储管理器可能会将50个可用闪存驱动器中的10个和两个cpu分配给VMware集群,然后将50个中的另外20个分配给Hadoop驱动的分析工作负载。可组合体系结构的优点是驱动器在内部不专属于特定的服务器,因此组织可以根据需要更改驱动器甚至服务器的用例。

一些存储制造商正在开发定制fpga和asic,通过将任务卸载给它们,帮助加速存储性能。

可组合产品依赖于群集软件提供存储功能的功能,这意味着存储的管理仍然单独执行在每个群集中。它还表明,功能和存储性能的全面性仍然主要取决于群集软件的存储功能的工作程度。最后,大多数可商品产品需要一种复杂的网络架构NVMe-oF这 - 在受欢迎程度中获得的同时仍然在数据中心的普遍附近。

提供定制的硬件消除存储系统的另一种选择是为存储系统提供更强的处理能力。

一些存储制造商正在开发定制现场可编程门阵列(fpga)和特定应用集成电路(asic),通过卸载任务来帮助加速存储性能。一些网络供应商已经提供了具有处理能力的网络接口卡,目的是让存储软件在卡上运行,而不是依赖于核心CPU。

如果放入,则目的是不明确的fpga或asic上的存储软件提高性能,或者只是使驻留的应用程序能够更充分地使用CPU。使用额外的硬件也有明显的成本劣势。此外,转移到专用FPGA或ASIC意味着供应商不再受益于英特尔持续的CPU开发周期。

重写存储软件从头开始大多数存储软件至少有10年的历史。即使是更新的存储系统也通常使用开放源代码库。从头重写为供应商提供重新考虑存储算法的可能性,例如存储软件将如何提供、引用和保护存储和数据。重新开始还可以让供应商确保其软件在本质上是更加多线程的。

但这个过程并不意味着不兼容。存储软件可以使用连接器来提供对传统块、文件和对象用例的支持。

挑战在于产品上市所需的时间。通过利用现有的软件库在美国,供应商可以在两到三年内交付新产品。但它不会与现有产品有很大的区别。采用“从零开始”方法的初创公司可能需要5年或更长时间才能完成第一个版本的测试。一个成熟的存储公司可能不得不秘密地运行它的项目,同时继续销售它的其他产品。

值得注意的是,存储软件将不再是瓶颈,因为它可以从系统中安装的每个驱动器提取全部性能,而需要的总体资源更少。

克服软件瓶颈的方法

通过克服软件瓶颈来提高存储性能对整个数据中心和供应商来说都是一个挑战。如果供应商不能解决这个瓶颈,网络供应商就没有必要建立更快的网络或存储硬件供应商开发更快的媒体

这里提到的替代方案——消除存储系统的概念、可组合的跨集群存储、自定义硬件和从头重写存储软件——为这个问题提供了可行的解决方案,但每一种方案都有其挑战。像往常一样,IT专业人员将需要决定哪些权衡是最合适的。

第4条第4条

深入了解存储优化

获得更多的存储空间

查阅我们所有的过期杂志 查看所有
搜索灾难恢复
搜索数据备份
搜索聚合基础设施
关闭
Baidu