Gorodenkoff——stock.adobe.com

新的IBM人工智能参考架构使用了英伟达的超级计算机

IBM推出了新的人工智能参考架构,渠道合作伙伴将使用英伟达超级计算机、IBM Spectrum Scale并行文件系统和IBM闪存构建该架构。

IBM已经在设计人工智能部署参考架构扩展其存储合作伙伴名单与超级计算机制造商Nvidia公司。

IBM的SpectrumAI与英伟达DGX参考架构结合了英伟达强大的DGX-1服务器和AI软件堆栈与IBM的闪存和Spectrum Scale并行文件系统软件。新的IBM AI融合基础设施的选项将完全通过渠道合作伙伴进行销售。

此次合作,周二透露,是IBM的第二AI参考架构与Nvidia的。去年6月,IBM提供的AI参考架构为其设计了Power服务器与NVIDIA GPU的,频谱存储软件和闪存存储。

IBM不是达成交易搭配Nvidia的参考架构的唯一供应商针对AI用例。纯存储了其AI就绪基础设施,AIRI,在三月份。NetApp的跟随在八月和DataDirect的网络(DDN)推出³我平台在十月。

像IBM,戴尔EMC有多个Nvidia的AI合作伙伴关系。戴尔EMC在十一月增加了一个AI参考架构,将Nvidia DGX服务器与全闪存Isilon存储捆绑在一起。此前,戴尔EMC推出了用于深度学习的AI Ready解决方案,使用的是配备高性能Nvidia的戴尔PowerEdge服务器gpu以及全闪光Isilon F800。

IBM AI参考架构的存储选项

IBM的SpectrumAI对Nvidia DGX参考架构为用户提供两种存储选项。IBM弹性存储服务器(ESS)是可用的基于闪存的固态驱动器,能够通过从10 Gbps到40 Gbps的。在中期,2019年,IBM计划新增一个基于NVMe,IBMFlashSystem 9100与频谱的比例配置,公司宣称将提供高达吞吐量的40 Gbps的。

IBM Spectrum AI集成了用于人工智能的Nvidia DGX服务器。
IBM Spectrum AI集成了用于人工智能的Nvidia DGX服务器。

埃里克·赫尔佐格,首席营销官和IBM存储全球渠道副总裁表示,IBM AI系统可以从300 TB扩展在低端8个百亿亿字节以上的高端。IBM频谱AI是可组合的,并且客户可以通过分别添加服务器,存储或附加的组件扩展系统。

据IBM称,装有9台Nvidia DGX服务器的机架,配备了72个特斯拉V100张量核心gpu,显示了120 GBps的吞吐量。赫尔佐格表示,带宽,而不是I/O或延迟,是AI部署的关键指标。

新的IBM AI参考体系结构的一个潜在区别是,客户可以附加额外的存储选项,以额外付费扩展基本参考体系结构。例如,客户可以添加IBM Spectrum Archive或IBM的云对象存储归档数据,或者他们可以添加光谱发现通过API来管理数据。

“它给你一个方法来创建一个非常终端到终端的AI参考架构,”赫尔佐格说。“AI需要不断地学习,这意味着该数据集只会越来越大。因此,拥有与Spectrum发现的可扩展性,以此来轻松分类和归档品牌,一个分化的解决方案。”

IBM AI差异

Gartner的高级主管和分析师Chirag Dekate表示,另一个关键的区别是IBM的战略,即让数据成为“人工智能管道中的一流公民”。通过Mellanox将Spectrum AI生态系统与DGX连接起来InfiniBand网络齿轮将使在低等待时间和高带宽中相同的命名空间的GPU处理器数据访问。

“这实际上意味着很多的RDMA[远程直接内存访问]操作你会经常在计算方面理论上可以做到在存储方面,也做,” Dekate说。

Dekate表示,IBM还支持通过频谱的比例更高的吞吐量,并与机器学习和先进的深度学习模型极高的可扩展并行数据访问。他说,大多数基于NFS的基础设施现在的选项提供了对数据的顺序访问,如果多个节点尝试访问数据,用户可能会遇到I/O瓶颈。他说,为了避免这个问题,工程师将数据复制到不同的节点,并分别访问独立的副本。

“由于IBM的频谱的比例是一个固有的并行文件系统,它们实际上可以具有一个复制并暴露,并提供到同时数据的不同部分的并行访问,” Dekate说。“而通过添加元数据层和逻辑分离到物理数据,它们能够跨多个节点的无缝访问。”

DDN的竞争对手DDN也通过InfiniBand和并行文件系统提供数据访问,但Dekate表示,DDN的主要重点是它的Lustre-based文件系统这可能更难管理,特别是对于没有经验的光辉工程师的组织。

Dekate表示,深度学习只占人工智能市场的一小部分。他说,许多企业将从简单的机器学习技术开始,不需要像Nvidia DGX-1这样的系统,具有千万亿次处理能力的gpu,NVMe-based闪光或并行I / O。他说,用户将看他们现有的内部基础设施和系统软件,以统一他们的数据层和解决他们独特的AI用例在他们考虑参考架构之前。

亨利·巴尔塔扎尔,在451 Research的研究副总裁说,他预计AI参考架构,以最终获得企业寻求简化其部署中的牵引力。在此期间,他说,很多可以通过更多的$ 1百万或AI参考架构的潜在价格标签被吓跑了。

巴尔塔扎尔指出供应商正在走出来简装具有较少的Nvidia DGX服务器或更少的存储AI的参考架构。他说,他还设想hyper-converged基础设施厂商加入GPU来他们的产品。他说,一些球员HCI已经有GPU的用于虚拟桌面基础架构,而不是AI。

IBM SpectrumAI和Nvidia DGX的定价大约为65万美元,包括单个Nvidia DGX-1服务器、IBM全闪存弹性存储服务器GS1S、IBM Spectrum Scale软件和IBM对ESS的安装支持。

深入挖掘人工智能存储

搜索灾难恢复
搜索数据备用
搜索聚合基础设施
关闭
Baidu