AMD分享了更多關於其Radeon AI PRO R9700 GPU的細節,以及它在AI任務中與現有Radeon PRO W7800的比較。
AMD最近透過ROCm 7擴展了其軟體,其當前的AI加速器策略涵蓋三大類別:中小型LLM的Ryzen AI MAX APU;針對多GPU邊緣推理和中小型LLM的Radeon AI PRO GPU;以及大型LLM(用於機架規模推理和訓練)的Instinct AI加速器。 AMD不僅詳細介紹了其MI350系列,還透露了Radeon AI PRO系列的更多AI統計數據。
AMD Radeon AI PRO R9700採用Navi 48 GPU,配備64個運算單元(4096個處理器)。該GPU配備128個AI加速器,TBP高達300W。記憶體方面,AMD Radeon AI PRO R9700配備32GB GDDR6顯示記憶體,運行在256位元匯流排上,實際上是9070 XT記憶體容量的兩倍。 AMD的其他效能方面還包括96 TFLOP 的FP16運算能力和1531 TOPS的INT4(稀疏)運算能力。
AMD Radeon AI PRO R9700 GPU的目標是有效率地完成高品質的AI模型。因此它配備了32GB的顯示記憶體,這對於大多數高階本地AI工作負載(例如 DeepSeek R1 Distill Qwen 32B Q6、Mistral Small 3.1 24B Instruct 2503 Q8、Flux 1 Schnel和SD 3.5 Medium)而言是最佳容量。
在效能方面,AMD表示Radeon AI PRO R9700在DeepSeek R1中的速度是Radeon PRO W7800 32GB GPU的兩倍,同時該公司也展示了一些與配備16GB VRAM緩衝區的RTX 5080的比較數據。 16GB VRAM可能不適用於需要更多記憶體的AI模型,因此R9700的速度最高可提升5倍。
深入研究計算指標,R9700將提供47.8 TFLOP的FP32性能、191.4 TFLOP的FP16/BF16性能、382.7 TFLOP的FP8性能、382.7 TOPS的INT8性能以及765.54 TOPS的性能。此GPU也將支援波矩陣乘法累積 (WMMA) 指令和結構化稀疏性。啟用稀疏性後,INT4 TOPS總效能將達到1531。 FP16效能比Radeon PRO W7800提升了2倍,而INT8/INT4效能則提升了4倍。
AMD也強調了為什麼支援更大的模式對於獲得更好的結果至關重要。在文字轉影像中,在FP16上運行的8B模型將產生比1B模型更好的結果。在推理方面32B 6位元模型將比8B 6位元模型產生更高的準確率。
AMD也展示了R9700和W7800在單一GPU上的FP16 AI效能對比,新版本在DeepSeek R1 Distill Llama (8B) 中的效能提升超過2倍。
但這遠不止於此;AMD Radeon AI PRO R9700還可使用現代PCIe 5.0平台擴充為4路多GPU配置。這使用戶能夠利用128GB的大量記憶體池,從而處理Mistral 123B和DeepSeek R1 70B等緩衝模型。這些模型最多可佔用112-116GB的VRAM。
最後關於上市時間,AMD Radeon AI PRO R9700 GPU將於今年7月透過華碩、華擎、技嘉、PowerColor、Sapphire、XFX和盈通等領先合作夥伴上市。此顯示卡將採用雙插槽設計,並配備鼓風散熱器。
消息來源
但這遠不止於此;AMD Radeon AI PRO R9700 還可使用現代 PCIe 5.0 平台擴充為 4 路多 GPU 配置。這使用戶能夠利用 128 GB 的海量記憶體池,從而處理 Mistral 123B 和 DeepSeek R1 70 B 等緩衝模型。這些模型最多可佔用 112-116 GB 的 VRAM。
2025-05-21_3-25-21
2025-05-21_3-25-22
2025-05-21_3-25-24
1 / 3
最後,關於上市時間,AMD Radeon AI PRO R9700 GPU 將於今年 7 月透過華碩、華擎、技嘉、PowerColor、藍寶石、XFX 和盈通等領先合作夥伴上市。此顯示卡將採用雙插槽設計,並配備鼓風散熱器。
|