近日,AMD推出了其第二代AMD Versal Premium系列,该自适应SoC旨在面向各种工作负载提供高水平系统加速,这是行业首款在硬IP中采用CXL3.1和PCIe Gen6,并支持LPDDR5存储器的器件。
AMD第一代Versal Premium系列产品更多关注的是加速网络,在高安全性、高通量和带宽的情况下加速网络。第二代Versal则主要针对数据中心、通信,以及测试测量市场中数据密集型应用,特别是数据中心应用需要越来越多的内存来支持大语言模型,因此,AMD增加了CXL内存的分享和池化。
生产工艺方面,第二代Versal Premium采用了6nm制程。之所以采用该制程,AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm 解释称,随着摩尔法则的衰减,现在制程的重要性越来越低,更重要的是架构,“所以也不可能像过去那样实现只有一半的功耗,但是可以达到双倍的性能。关键这里的问题就是看用例是什么,针对什么样的用例,通过这样的方式选择合适的计算引擎来解决问题。我们Versal系列的产品总是能够非常精准地去针对一些关键的应用,来确保能够有最合适的关于算力、I/O以及内存的组合,实现最高的性价比,而不总是采用最新的制程。”
谈到第二代AMD Versal Premium系列,AMD自适应和嵌入式计算事业部( AECG )高级产品线经理Mike Rather主要强调了该系列产品在三个领域的创新,即加速主机连接、释放更多内存,以及加强数据安全。
加速主机连接
加速主机的连接对于现在高端的应用非常关键。AMD在Versal Premium自适应SoC和AMD EPYC CPU之间能够形成很好的协同。PCIe Express能够提供Versal Premium和CPU之间非常高性能的连接,这可以用于卸载计算、网络以及存储工作负载。也能拥有非常连贯的接口,这样Versal Premium和EPYC处理器就能够共享内存空间,从而减少搁置内存。再加上PCIe IDE以及内存DRAM的加密,数据能够做到端到端的安全性。
AMD通过支持CXL来倡导开放式创新,CXL是处理器与器件之间的开放式行业标准互连技术。第二代Versal Premium器件支持业界最快的主机接口CXL 3.1和PCIe Gen6,高达64Gb/s,可实现高带宽主机CPU到加速器连接。与支持 PCIe Gen4 或 Gen5 的 FPGA 相比,PCIe Gen6 能提供了 2 至 4 倍的线速率2,而运行 PCIe Gen6 的 CXL 3.1 在类似时延下则能提供使用 CXL 2.1 器件的双倍带宽3,以及增强的架构和一致性功能。
值得一提的是,第二代AMD Versal Premium系列内部的DSP计算密度得到了进一步的提升,实现了更高的每平方毫米的DSP算力,可支持多种工作负载。
Mike Rather表示,AMD在第二代AMD Versal Premium系列增加了一个新的收发器-----GTM2。GTM2它能够结合第一代Versal Premium产品上面的两个收发器,一个是GTM,还有一个是GTM1。GTM2能够支持的数据速率是从1.25 Gb/s到128 Gb/s,同时还支持NRZ和PAM4编码。“我们也保留了非常熟悉的设计流程,所以开发者可以使用GTM2,同时还确保全过程的可靠性。”他强调。
此外,在I/O方面,AMD增加了对于高速MIPI C-PHY和D-PHY接口的支持。
提高存储器带宽与利用率
由于现在人工智能方面的应用越来越普遍,使得数据量越来越大,因此,更快速的释放更多内存显得非常重要。第二代AMD Versal Premium系列在DDR5和LPDDR5上支持的数据的速率是其第一代产品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率是有20%到30%的下降。更重要的是,AMD还增加了硬内联ECC与加密来保护内存。
与 CXL 存储器扩展模块进行连接可使总带宽较之单独使用 LPDDR5X 存储器高出至多 2.7 倍5。因此,第二代 Versal Premium 系列允许为多个加速器实现可扩展的内存池和扩展,进而优化存储器利用率并增加带宽和容量。
通过为多个器件动态分配内存池,第二代 Versal Premium 系列自适应 SoC 旨在提高多头单逻辑器件( MH-SLD )的存储器利用率,使其无需架构或交换机即可运行,同时支持至多两个 CXL 主机。
数据安全加密
在不断变化的安全形势下,增强数据安全性正变得日益重要。增强的安全功能有助于第二代 Versal Premium 系列在传输和静态状态下均可快速、安全地传输数据。
其是业界首款在硬IP中提供集成PCIe完整性和数据加密( IDE )支持的 FPGA 器件。硬核 DDR 内存控制器内置的内联加密可助力保护静态数据,而400G高速加密引擎则能帮助器件以至高2倍的线速率保护用户数据,从而实现更快速的安全数据事务。
工具支持,产品表及时间表
Vivado是AMD所有的Versal器件统一的设计环境。据Mike介绍,AMD也在不断地改善Vivado的开发环境,每次发布都有改善,适用于所有的Versal,也包括第二代AMD Versal Premium系列。
目前,AMD通过采用新的P&R算法,并且改善多线程的性能,还有增强的增量流,减少编译时间。此外,AMD引入了用于顶层设计的RTL流程,以及用于GTM2的RTL流程。
全新的第二代AMD Versal Premium系列产品共有4种。从140万逻辑单元到330万逻辑单元不等,从3300到7600的DSP引擎,有片上内存和内存控制器。另外还有双核A72应用处理器、双核R5F实时处理器。有从32到72的GTM2收发器,PCIe和CXL方面的器件,还有100G和600G的以太网MAC,以及400G的高速加密引擎和LDPC的解码器。
供货情况方面,第二代AMD Versal Premium系列产品的早期文档将会在2024年11月提供,功率估算工具提供的时间为2024年Q4,第二代 AMD Versal Premium 系列开发工具预计将于 2025 年第二季度提供,随后于 2026 年初提供芯片样片。预计将于 2026 年下半年开始量产出货。
全部评论