随着 AI 成为组织创新和竞争优势不可或缺的一部分,对高效且可扩展的基础设施的需求比以往任何时候都更加迫切。NVIDIA 和 DDN 存储之间的合作正在为这一领域建立新的标准。通过将 NVIDIA BlueField DPU 集成到 DDN EXAScaler 和 DDN Infinia 中,并以创新的方式使用它们,DDN 存储正在改变以数据为中心的工作负载。
NVIDIA 先进的数据处理与 DDN 强大的存储解决方案的协同作用优化了 AI 工作流程,增强了运营,提高了资源利用率,并在AI 环境中支持多租户。
在这篇文章中,我们重点介绍与 Infinia 的集成优势。
集成式 DPU 存储解决方案
DDN Infinia 是一个软件定义数据平台,它利用 BlueField-3 DPU 的强大功能来有效管理以数据为中心的工作负载,尤其是在加速计算和生成 AI 方面。集成增强了多租户、提高了运营效率并增强了数据保护。这使其成为使用 AI 和云技术来推动创新和运营敏捷性的组织的理想解决方案。
他们的解决方案涉及几个关键组件:
• 卸载数据处理 • 加速存储性能
• 提高效率 • 支持多租户
• 增强安全性 • 增强扩展
卸载数据处理
BlueField DPU 通过接管数据处理任务来减轻 CPU 负担,从而释放计算资源并提高整体系统性能。这种存储和安全任务的卸载可以提高 CPU 使用率,从而显著减少延迟并加快数据处理速度。
加速存储性能
DDN 的存储解决方案由 BlueField DPU 提供支持,可提高 AI 工作负载的存储性能。利用 BlueField DPU 的高级数据处理功能,这些解决方案可实现更高的吞吐量和更好的系统响应能力,从而加速 AI 应用程序。
NVIDIA GPUDirect Storage (GDS) 有助于 GPU 平台和存储之间建立直接数据路径,更大限度地减少了系统内存流量,从而提高了带宽并降低了 CPU 负载,以优化 AI 工作流。
提高效率
传统存储系统在通用 x86 CPU 上执行各种任务,例如闪存管理、RAID、访问控制和加密。然而,随着网络速度和安全需求的不断增加,这些系统变得越来越低效。
将 BlueField DPU 集成到存储服务器和主机访问中,可通过卸载和加速 NVMe-oF 存储协议等任务显著提高存储效率,从而为其他应用程序释放 CPU 资源。
支持多租户
DDN Infinia 存储平台采用容器化,使不同的存储功能可以在单独的容器中运行。这种架构通过将任务卸载到 DPU 来提高可扩展性并优化整个数据路径,从而减少延迟。
多租户部署将多个命名空间整合到一个单一文件系统中,从而提高容量利用率、降低硬件成本并简化部署和管理。
BlueField DPU 基于硬件的隔离和资源分配功能使多个用户和应用程序之间能够安全地共享基础设施资源,从而提高资源利用率和运营效率。
图 1 显示 DDN Infinia 提供原生多租户功能,可安全地隔离用户数据;在所有租户和子租户中应用高效的 QoS(Quality of Service,服务质量)算法;并确保在传输、静态和组织间共享期间的数据保护。
增强安全性
BlueField DPU 的专用处理资源和内存提供了一个安全的环境,防止未经授权的访问并防止潜在的攻击。硬件加速加密可确保存储在存储系统中的数据是静态加密,从而保护敏感信息。
BlueField DPU 的访问控制机制使管理员能够定义和执行细粒度的访问策略,确保只有授权用户或应用程序才能访问和修改数据,并具有安全启动功能,可在启动过程中验证固件和软件组件的完整性,防止篡改或未经授权的修改。
从主机 CPU 卸载与安全相关的任务可减少攻击面并释放 CPU 资源以用于其他关键任务。
凭借这些组合安全功能,BlueField DPU 为 AI 工作负载和从 DPU 到 CPU 的数据提供了强大而安全的存储解决方案。组合技术堆栈可确保数据受到保护,从而解决 AI 驱动环境中的数据安全性和完整性问题。您的组织可以针对网络威胁和未经授权访问提供更强大的保护,从而增强整体数据安全性和合规性。
增强扩展
DDN Infinia 是一个完全容器化的平台,围绕一组精心编排的微服务构建,可提供整个存储服务。使用 BlueField DPU,DDN 开发了一种支持完整云原生堆栈的全新架构。这种对BlueField DPU的创新使用使存储平台能够扩展到整个网络。
具体来说,DDN Infinia 的 Amazon S3 对象服务是容器化的,可以通过使用 NVIDIA DGX 客户端系统中的 NVIDIA DPU 资源,独立于 Infinia 存储系统运行。这种设计转变彻底改变了数据在存储系统中的流动方式。传统上,Amazon S3 对象调用是在本地调用在BlueField 上运行的服务。传统存储依赖于通过网络发送的命令(RESTful 调用),这可能会很慢。
使用 BlueField,这些调用将被从 DPU 到存储系统的 RDMA 调用所取代。这会从主系统中卸载存储任务并使用更高效的数据路径,从而显著减少延迟并提高 AI 加速的带宽。这种存储架构的重新配置改变了 Amazon S3 对象数据路径,从而显著提高了性能和可扩展性。
总结
DDN 和 NVIDIA 之间的合作有望显著推进数据中心基础设施上的 AI 应用,为更高效、更安全的 AI 驱动工作流奠定基础。通过利用先进数据处理和存储解决方案的综合优势,您的组织可以期待 AI 计划的效率、可扩展性和安全性得到提高。
全部评论