Hot Chips 2025:AMD RDNA 4模块化SoC设计将推动GPU多样化与能效提升

前沿资讯 1756202887更新

0

在Hot Chips 2025大会上,AMD详细介绍了其下一代RDNA 4 GPU架构的模块化系统芯片(SoC)设计,以及全新的内存与带宽压缩技术。凭借高度灵活的模块化设计,该架构可衍生出多种不同规格的GPU产品,同时在降低内存与带宽需求方面实现显著突破。

AMD已于今年2月首次公开RDNA 4架构。本次大会上,AMD SoC架构师Laks Pappu在演讲中详细介绍了RDNA 4的模块化SoC架构。该设计采用高度灵活的芯片结构,可扩展出多种配置,适用于不同级别的Radeon产品。Pappu同时透露,类似的模块化SoC策略也将应用于后续的RDNA 5/UDNA系列中。

模块化设计的核心在于其可裁剪性与可扩展性。AMD通过红色标线直观展示芯片模块的切割与扩展方式。以Navi 44为例,该芯片配置两个着色器引擎与四组GDDR6内存控制器(128位位宽),并可进一步通过增减着色器引擎、L3缓存、Infinity Fabric连接与内存控制器数量,实现向高端型号(如用于RX 9070 XT显卡的Navi 48)的扩展。

从架构图来看,Navi 4X SoC中包含多个着色器引擎(Shader Engine),每个引擎内置多组工作群处理器(WGP),每个WGP则集成两个计算单元。这些组件通过GL2缓存与内存控制器及最后一层缓存(LLC)通信,并依托新一代高性能Infinity Fabric互联技术实现协同运行。Infinity Fabric以1.5–2.5 GHz频率运行,带宽达到1KB/时钟周期。

这一设计还增强了芯片的安全性,可为不同组件提供分级权限控制,并集成可靠性、可用性与可服务性(RAS)机制。此外,AMD在RDNA 4中引入了新一代压缩与解压缩算法,使得在某些光栅化工作负载中性能提升15%,Infinity Fabric带宽需求降低25%,从而显著减少功耗。这些压缩技术完全由硬件实现,无需软件额外适配。

值得注意的是,AMD首次提及在低端RDNA 4 GPU SoC中使用LPDDR内存的可行性,但也指出,虽然LPDDR具备低功耗优势,其带宽仍不足以满足显卡需求,且芯片封装尺寸会因接口数量增加而扩大,因此目前仍非独立显卡的理想选择。

针对RDNA 4相比前代产品内存带宽降低的质疑,AMD回应称,内存带宽需求实际取决于工作负载类型。通过对RDNA 4架构的深入优化,AMD已在图形处理单元中实现了对带宽依赖的显著降低。

AMD多次强调,RDNA 4的模块化SoC架构为其带来前所未有的产品配置灵活性。通过四种不同的硬件屏蔽策略,AMD可基于市场需求快速衍生出多款产品型号,进一步巩固其在GPU市场的技术竞争力。

参考资料:https://wccftech.com/amd-rdna-4-modular-soc-flexible-configurability-helps-spawn-smaller-gpus-navi-44-features-to-reduce-memory-bandwidth/