帖子

大内存简介

了解为什么涉及到大数据和大存储器时总是内存和存储,可能导致性能问题的空隙,内存管理程序如何帮助缓解这些问题等等。

下载演示文稿:大内存简介

00:01查克·索贝:您好,欢迎来到闪存峰会的大记忆介绍。我用沟道疯狂嘶嘶作响,我也是你的FMS会议椅。如果几乎,我们很高兴能够在今年加入我们。我们将通过建立大数据和大存储器的意味着来开始此更新。我们会看到为什么有些内存和存储。我们将触及持久媒体,认识到明确的领导者是英特尔的Optane.然后,我们将识别管理异构内存架构,阻止性能的空隙中存在的间隙。这将在本次会话中设置其他会谈的阶段,该阶段解释内存虚拟机管理程序如何如议员的记忆机有效地弥补这些差距。事实上,我们将看到这种组合可以比同类内存解决方案的性能更好,后者的成本要高得多。本次演讲的最后,我们将探讨下一个发展机遇所在。

01:03 CS:大数据这个词已经出现很长时间了。在回答这个问题之前,“什么是大数据?”让我们来看看大数据的用途。大数据集被用于解决数学、科学和医学中的大问题。对于高性能计算来说尤其如此。当需要实时股票交易或推荐引擎等快速事务时,为了获得最佳性能,整个数据集应该在内存中。当然,用数百万个参数训练人工智能模型需要访问tb级的数据。

01:40 CS:那么,大数据存在于何处,又是如何处理的呢?传统上,数据存储在存储器中,工作在内存中,通勤非常糟糕。从图中可以推断出层次结构。on进程或缓存位于层次结构的顶部。主板上的DRAM和网络或总线上的存储器在层次结构中更低,但容量更大,将数据从SSD带到DRAM到缓存进行处理,所有这些都需要电力和能源。内存和存储层次结构由这个三角形表示,相应的硬件层在这里标识。快速昂贵的存储器离处理器最近,较慢的大容量存储器离处理器最远。添加这个差距是为了表明当CPU需要使用来自主内存的数据而不是来自其缓存中的数据时,存在很大的性能差异。以下是英特尔如何说明性能和容量差距。请注意从缓存中获取数据与从芯片外DRAM中获取数据之间的差距,以及从DRAM中访问数据与从高容量硬盘等存档中获取数据之间的更大差距。

03:24 CS:所以现在让我们回答原始问题什么是大数据.大数据有不同的定义,但对我来说,大数据是一个数据集太大,无法放入主内存。你拥有的数据比DRAM还多。处理这个问题的典型方法是在数据中心将数据划分到多个内存中,然后在多个处理器中计算任务。在个人电脑中,从慢速存储中分页数据是另一种方法,尽管并不令人满意。但正如我们所知,当处理器计算所需的数据在它自己的DRAM中时,才能获得最快的性能。这就是为什么我们要用更大的内存来解决涉及更大数据量的问题。大数据解决了大问题,也引发了一些问题。IDC预计,未来四年,全球数据的复合年增长率将达到26%。我们的数据增长速度超过了存储能力的增长速度。 Over 20% of the data will be real time data, data that must be acted on in real time. This can only be addressed in memory. In the remainder of this presentation, we'll set the stage for the answers that the other presenters in this section, in this session rather, will provide to the question, "What if big data had bigger memory?"

04:55 CS:大数据需要大内存,大内存需要大数据。但在任何关系中都可能出现问题。在这种情况下,大内存并不等于增加更多的数据。DRAM是不稳定的,如果电源中断或出现故障,股票交易或预订等实时数据就会丢失。DRAM成本高昂,确保其数据不丢失所需的措施也是如此。有时这是通过电池支持的NAND闪存内存完成的,但NAND容量并不能增加可用的内存容量。另一个问题是CPU税。为了在处理器板上获得足够的DRAM插槽,通常需要购买比应用程序所需更多的计算,服务器购买者称之为CPU税。为了获得所需的内存带宽或内存容量,通常有两种方法,一种是购买价格昂贵的服务器,其CPU插槽和内存插槽数量超过应用程序的需要,但使用容量较低的内存,另一种选择是购买更多但更小的系统,两个或可能有四个CPU插槽,并用更高容量和更高成本的dimm填充DRAM插槽,如果我们可以在DDR总线中使用更便宜、更高容量、非易失性或持久内存,会怎么样呢? Flash is too slow, but there are other technologies to consider.

06:35 CS:许多类型的持久记忆或者PMEM可用或正在开发,这些包括各种类型的磁力RAM,相变存储器和电阻RAM,持久的存储器与最大的市场份额到迄今为止,利用其3D交叉点技术,有些表征相位变化内存的类型,从英特尔的幻灯片显示其产品如何在我们之前介绍的存储层次结构中解决内存。值得注意的是,Optane SSD本身在它们内部有层次,我们可以看到在这个PCB上,我们有慢速但高容量的QLC NAND被更昂贵且更快的Optante持久存储器缓冲。

07:43 CS:持久存储器是一个不断增长的市场。IDC预测市场持久记忆的复合年增长率将上升近250%,这将导致26亿美元的市场三年,这是一个有吸引力的增长速度,角度,注意,DRAM市场是巨大的,每年约为600亿美元,每年600亿美元用于建造大量晶圆厂,投入大量研发资金,为了达到市场增长所要求的容量,并提高其相对于DRAM的成本优势,持久性存储器的投资必须持续并增长。这个成本优势可以从这个对比图中看到,最小容量的Optane DIMM, 128g的成本不到相同容量的DRAM DIMM的三分之一。

08:45 CS:我们的朋友,Jim Handy和Tom Coughlin项目,即持续内存的字节数将在10年内与DRAM达到平价,必须花费大量的资金来花在专用的工厂和发展中,以实现这一目标。在将这些预测视为未来之后,我们现在将注意力转回,实际使用Optane持久的内存是什么样的?Optane旨在用于异构内存架构,其两个寻址模式反映,它们是内存模式和应用直模式,内存模式使用PMEM作为主存储器。

09:34 CS:DRAM简单地,它的快速缓存,在APP直接模式下,DRAM是主要内存,并且PMEM是应用软件直接寻址的额外内存,这意味着应用程序需要重写以实现这一目标,而这一直是采用的障碍。特别是在数据中心。议员在本次会话中也发言,他们为异构内存创建了一个新的虚拟机管理程序,他们的内存机器管理程序提取者,摘要DRAM和PMEM接口,因此异构内存可以作为一个大的内存解决,它可以使用所有的Optane寻址模式而不需要应用程序软件更改,内存机器缩小到128个节点,最多可为768兆字节的主内存,那是每个节点的六个Terabytes,以及每个节点的128千兆字节到768千兆字节的DDR4 DRAM。其他发言者将有更具体的细节和结果。768 terabytes是很多记忆,但其中一些是慢的PMEM。现在这种影响性能如何与所有DRAM同质记忆相比?此比较报告了40千兆字节MySQL数据库的基准性能,结果适用于异构内存的各种DRAM和PMEM配置。在这个图表上,更高更好。

11:18 CS:这个基准是由All DRAM的性能设定的,128gb的DRAM在这个基准上超过47,000,而Optane,只有同等大小的系统才达到这个指标的75%。但是花费只有三分之一。令人惊讶的是,添加两个字节的DRAM PMEM 128 g的,添加了一个大幅增加性能,增加了一倍,4让我们几乎与所有平价DRAM的解决方案,和16 gb的DRAM和128字节的PMEM实际上比DRAM同质的所有内存解决方案,问MemVerge他们是如何做到这一点的,这将是一个很好的问答问题。持久化内存不仅仅是为了增大内存,如果管理得当,持久化可以使新特性成为可能,例如,这张幻灯片比较了使用内存机恢复快照和从日志恢复不同大小的KDB+数据库。220 g的数据库需要144秒恢复日志,70%,大的380 gb的数据库需要3 1/2倍的时间来恢复,536 g的数据库太大,系统测试日志恢复,MemVerge能够恢复的,在大约一秒。

13:00 CS:这不仅仅是更大的内存,而是更好的内存,这些性能增益是惊人的。这让我想知道性能存储将是必要的在未来,也许会重新定义或妄此外,正在开发一些新的接口设计的异构系统的内存和计算,他们可能使改进MemVerge使得本地内存扩展到更大的池,网络内存,这里显示的接口,除了DDR DRAM接口,还有CXL, OpenCAPI的开放内存接口子集,GEN-Z,和CCIX。它们倾向于串行接口,这比并行接口需要更少的引脚,这意味着有更多的空间让通道连接到CPU,这些接口支持网络连接,有些近,有些远,这样内存就可以被非本地处理器和加速器访问。

14:09 CS:有些如CXL和CCIX也被设计为提供缓存一致性。总而言之,我将关注明年及以后在大内存方面的一些发展,即数据中心、内存、计算和存储的关键元素将是异构的。从MemVerge所展示的情况来看,整体将大于部分之和。新的接口将极大地扩展被认为是本地内存的大小和位置,这应该为管理软件提供的新功能创造机会,具有轻量级的足迹,新兴的硬件,软件和接口将使新的架构开始于数据中心,并将支持实时和更大的数据问题解决。我们将不再需要决定我们的内存是大还是快,有了适当的大内存管理,它将是大而快的。感谢您观看这个演示,请访问我们赞助商的虚拟投标。我期待着回答你在聊天中可能会有的任何问题,活动结束后,你可以通过这里显示的电子邮件地址联系我。享受第十五届年度闪存峰会剩下的部分吧。

下一个步骤

新的高速接口适合哪里,它们如何一起工作

在闪存上深入挖掘

搜索灾难恢复
搜索数据备用
搜索聚合基础设施
关闭
Baidu