电子手册:

部署的NVME时如何解决存储延迟问题

谢尔盖·尼文斯-福托利亚

管理 学习应用最佳实践并优化您的运营。

有效的NVMe-oF性能监视最佳实践

不要让您的存储网络基础设施妨碍交付NVMe-oF的低延迟好处。看看这些最佳实践如何在问题发生之前修复它们。

NVMe承诺将存储设备和处理器之间的内部通信延迟减少到100微秒以下。的NVMe应该为共享存储带来同样的低延迟。

作为一个结果,NVMe因为人工智能、机器学习、大数据分析等低延迟需求而重新流行的DAS有机会被淘汰。IT专业人士面临的挑战是将NVMe-oF性能监视放在适当的位置,以确保网络配置的交付NVMe的低延迟

为什么性能监控的NVMe至关重要

在过去,存储网络是存储基础设施中速度最快的一组组件。应用程序、存储系统和存储设备远比网络交换机和适配器潜伏得更久。一个配置错误的网络端口,网络适配器或低于等级的电缆通常不会被发现。在大多数情况下,将存储网络升级到更高带宽的唯一动机是在相同的价格(或更便宜)下获得更快的速度。

现在,我们有了NVMe的连接存储系统,其中包含NVMe存储介质,并与使用更多存储介质的企业相结合人工智能、机器学习和大数据分析应用。因此,网络的核心面临着跟上步伐的压力。网络中的任何错误配置都意味着它将成为降低存储硬件和高级应用程序速度的瓶颈。在影响性能之前检测网络中的问题至关重要。

NVMe-oF性能监视如此重要的另一个原因是应用程序所有者的高期望。他们希望应用程序的性能达到存储系统所承诺的水平。在大多数情况下,安装一个更快、更高带宽、更低延迟的存储系统和网络会有所改善应用程序性能,但它可能不足以提高性能,以满足这些期望。与过去不同的是,在大多数情况下,应该归咎于应用程序。然而,由于历史原因,IT基础设施人员必须证明网络和存储系统的配置正确,才能实现承诺的性能。换句话说,他们必须证明自己的清白。

NVMe-oF性能监视最佳实践

如何监控无延迟网络

IT如何从一开始就正确配置存储基础设施,保持在更改的顶端,并在应用程序所有者抱怨性能时证明基础设施正在正确执行?

这一切都归结于收集和理解网络交换机已经产生的遥测数据。一个网络交换机“查看”从应用程序发送到存储系统的每个I/O,但收集数据并在繁忙的it专业人员能够快速解释的情况下呈现数据往往是缺少的环节。

NVMe和NVMe- of的低延迟,再加上现代工作负载的I/O需求,意味着糟糕的网络设计和配置再也不能隐藏在其他存储基础设施组件的延迟背后。

在低延迟网络中,大量流量通过网络的速度如此之快,以至于捕获遥测数据可能会错过影响网络性能的事件。尝试每秒捕获每一位遥测数据可能会影响总体基础设施性能。大多数存储网络监控工具每隔10秒拍摄一次网络流量I/O和交换条件的快照,以轮询间隔收集数据。

大量的I/O可以在10秒内通过网络的NVMe。在此期间,轮询工具可能会错过问题的关键指标。他们可能无法向IT部门提供所需的信息,以确定异常是异常还是问题的根源。但是,缩短数据捕获间隔会增加性能影响的可能性,并且该工具可能无法存储它捕获的所有数据。

另一种选择是实时遥测捕获,但在这里,如果在交换机上执行,捕获可能会影响性能。今天,与过去一样,组织使用网络接头,在网络基础设施布线上进行内联连接。这些抽头可将信息实时反馈至遥测分析软件解决方案,而不会影响交换机性能。但是,安装水龙头可能会造成中断。虽然存在解决办法,但大多数IT专业人员认为tap安装期间会出现停机。

与其在特定的间隔轮询或检查实施水龙头的成本和潜在的中断,一个组织可能想要寻找具有专门的遥测应用特定集成电路的网络交换机(专用集成电路)。专用ASIC可在不影响性能的情况下实现实时遥测数据捕获。

遥测捕捉只是成功的一半

在不影响存储网络性能的情况下实时捕获遥测数据是监控高速、低延迟存储网络的关键步骤。下一步是将这些数据组装成一些东西,以便忙碌的IT专业人员可以快速诊断网络资源中的任何潜在问题或潜在即将到来的不足。

寻找不仅能清晰显示遥测数据,还能使用机器学习和大数据分析帮助诊断网络问题的工具。长期目标应该是通过让网络监控系统监视管理员解决问题的步骤,来培训网络监控系统自动采取纠正措施。

NVMe和的NVMe的低延迟,再加上现代工作负载的I/O需求,意味着糟糕的网络设计和配置不能再隐藏在其他存储基础架构组件的延迟后面。IT部门需要主动监控存储网络基础架构设计和资源消耗,以确保它始终领先于公司的I/O需求。

实时遥测捕捉,当由开关asic驱动时,使组织能够进行这种NVMe-oF性能监视,并查看其网络在任何给定时刻发生了什么。结合正确的分析和表示工具,IT应该能够在潜在热点出现之前主动修复它们,并为未来的基础设施需求做计划。

下一个步骤

使顺利移动到NVMe

你的一系列问题回答

了解NVMe的许多好处

深入研究NVMe上的织物

搜寻灾难恢复
搜寻资料备份
搜寻聚合基础设施
关闭
Baidu