本内容是买方指南的一部分: 浏览全闪存阵列存储购买过程

batway体育

浏览部分

建立全闪存阵列存储的商业案例

要确定购买AFA存储的业务案例,您必须首先了解应用程序在IOPS、延迟和吞吐量方面的需求。

在确定组织是否可以从全闪存阵列存储中受益之前,必须收集有关工作负载的信息。您的应用程序需要更多的IOPS或吞吐量,还是更低的延迟?它们是读密集型还是写密集型?您可能需要使用工具来确定性能瓶颈并描述数据性能。您需要了解全闪存阵列存储的操作方式与磁盘阵列不同。

记住所有的flash存储阵列并不都是一样的。许多系统在构建时都考虑到了特定的应用程序或工作负载,一个能使一个应用程序运行速度快100倍的全闪存存储阵列不一定会对其他工作负载产生类似的影响。应用程序可以利用重复数据删除和压缩特性在全闪存阵列(AFA)存储中,如虚拟化应用程序,将比处理已经压缩和独特的数据(如视频文件或实时流)的系统更划算。

hdd与ssd相比如何?

存储系统中的hdd硬盘可能会导致应用的性能瓶颈。例如,将读/写磁头从磁盘的一个位置移动到另一个位置以读取信息所需的时间会导致访问信息所需的最小、平均和最大时间之间存在相对较大的差距。此外,从磁盘上最内层的磁道读取大量数据所花费的时间要比从最外层的磁道读取数据所花费的时间要长,这是因为每毫秒经过磁头下的比特数随磁盘上的位置而变化。

固态硬盘(ssd)在最小、平均和最大读取延迟之间的变化要小得多。这使它们成为读密集型应用程序的理想选择。ssd盘的速度也足以支持实时重复数据删除。这有助于使用许多类似磁盘映像的应用程序,包括服务器虚拟化和虚拟桌面基础结构(VDI)。因为在典型的微软Windows或Linux操作系统安装中,数百万个文件中的大部分都是系统间相同的,所以100个虚拟操作系统所占用的空间只比一个文件多一点。

但ssd也有自己的致命弱点:写放大.这种现象是由于ssd需要擦除整个块并重写它,以改变该块中的一位。根据块的大小,SSD可能需要重写256kb到4mb的数据来保存一位新信息,导致写入的放大率为256,000:1和4,000,000:1。在写密集的情况下,必须使用特殊的算法来解决这个问题,以便尽可能地收集对SSD上相同块的写。这允许系统在同一时间向同一个块写入多个更改。

还有一个类似的问题垃圾收集,即对已重写的数据块进行回收。对于HDD,已写入的文件通常会无限期地留在磁盘上的相同块中。由于数据可以写入每个SSD单元的次数有限,数据经常被重写到新的块,以确保所有单元都被使用。这个过程被称为磨平。一旦数据被重写,旧的单元必须被擦除才能再次使用。跟踪要擦除的单元,然后再擦除它们会导致额外的写放大,除非存储系统的算法被优化到避免穿平

即使有写放大,全闪存阵列存储系统通常也比基于hdd的系统快得多,但获得系统最佳性能的最佳方法是不同的。的最新的全flash存储系统被设计为最小化写放大和垃圾收集的影响,但是如果您有写密集的应用程序,您可能希望自己做一些测试,以确定最优配置。

全闪存阵列存储的优点和应用

AFA存储可以大幅提高存储性能——包括更高的IOPS、更高的吞吐量和更低的延迟——同时通过内联压缩和重复数据删除增加系统的有效容量。了解这些如何工作是很重要的,以便了解数据中心中的应用程序是否能够从全闪存阵列存储系统中获得最大的好处。

有些应用需要IOPS,有些需要低延迟,有些需要高吞吐量。例如,服务器虚拟化和VDI应用通常受IOPS影响最大,高性能计算和数据库对时延敏感,视频系统需要高吞吐量。能够描述您的应用程序和它们的需求,将有助于实现新的AFA存储系统。

测试和基准测试应用程序,无论是纯软件产品还是设备,都可以帮助您查找当前系统的问题,并用于创建测试,以查看AFA系统是否能够处理流量。记住,你不能消除瓶颈,只能移动它们。提高系统某一部分的性能只会暴露下一个阻塞点。

需要更多IOPS的应用。通常执行许多并行操作的系统需要大量的IOPS.其中包括服务器虚拟化和VDI,还包括具有许多同时用户的数据库系统,从搜索引擎(如谷歌)到电子商务应用程序(如Amazon)。尽管许多全闪存阵列供应商都在宣传他们的产品可以达到100万IOPS或更多,但这些数字在现实世界中很难实现。基准测试应用程序可以生成数百万个小(2 kb)请求以获得更高的请求数,而现实应用程序倾向于使用更大的请求(100 kb到兆字节)。

这就使得对应用程序进行基准测试和设置测试床存在问题。一个单台全闪存SAN系统加上几个服务器是不够的,即使是10gb或更快的连接也不行。有时,更好的解决方案是要求供应商提供已经实现了与您的组织使用相同应用程序的系统的客户联系人,并与他们的数据中心管理人员讨论在与您类似的环境中实现AFA存储时发现的问题。

受延迟影响的程序。堆栈处理、在集群中的节点之间传递数据的应用程序对延迟问题特别敏感。因为应用程序的各个部分都在等待前一部分的数据,任何处理或传输数据的延迟都可能导致下游的进一步延迟。高性能计算系统、集群数据库、实时和流应用程序都对延迟非常敏感。在测试时,平均或平均延迟比最小延迟提供更多信息,但查看最大延迟也很重要。如果有的话产生延迟的条件它比正常情况大很多倍,值得研究。

具有高吞吐量需求的应用程序。移动大量数据的应用程序需要高吞吐量。这些应用包括特效视频处理,使用大数据集进行数据分析比如地震分析和数据挖掘。它们都依赖于共享和处理从数百gb到pb的大量数据。能够移动数据是至关重要的,通常需要大型管道(10gb到100gb以太网、16gbps或32gbps光纤通道)和网络堆栈层的有效数据处理,以及通过LAN或WAN连接传输的数据的重复数据删除和压缩。

与其他I/O度量一样,也存在一些不太明显的吞吐量问题。例如,从1 Gb以太网连接移动到10 Gb以太网连接将产生更高的吞吐量,但也可能将服务器利用率提高10倍或更多。这可能会使运行在25%利用率的服务器变成运行在50%或更多利用率的服务器来访问数据,当网络利用率达到峰值时,这可能会导致崩溃或日志堵塞。

支持全闪存阵列存储

要证明对AFA存储的升级是合理的,首先要收集足够多的数据,这样才能不仅仅说明网络速度慢。数据收集工具从微软的系统管理服务器或系统中心配置管理器或VMware的vCenter内置的日志功能,到SolarWinds存储管理器等专门工具。这些工具有助于查明瓶颈并描述数据性能。他们还构建历史趋势数据,例如,显示系统的增长速度将在6个月或1年内导致问题。通过这些数据,您可以在增长开始影响应用程序性能之前处理它,从而主动构建新的存储层。

多层应用程序很复杂,有许多不同的服务器在它们之间传递数据,所以简单地将硬件扔给一个缓慢的应用程序可能根本没有帮助。在升级任何东西之前,有必要隔离真正的问题,找到根本原因,然后测试所建议的解决方案。幸运的是,大阿发供应商将经常使试验系统和专家系统工程师在售前环境可用。利用这种专门知识可以帮助存储管理员向财务把关人证明新系统是必要的,并且将使组织受益。

下一个步骤

NVMe-based企业闪光预计将提供速度和延迟突破

闪存的优点和缺点在hyper-converged系统

满足我们的2016全闪存存储系统决赛选手

深入挖掘全闪存阵列

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu