找回密碼註冊
作者: sxs112.tw
查看: 4433
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

A3-mATX 玩家開箱體驗分享活動

[*]簡約時尚設計 26.3L 微型機箱 [*]側板和頂板採用鋼網設計 [*]可 ...

PURE WINGS 3 玩家開箱體驗分享活動

PURE WINGS 3卓越效能,安靜散熱 Pure Wings 3 是 be quiet! 的主流 ...

Hydrogon D140 ARGB 玩家開箱體驗分享活動

Hydrogon D140 ARGB高效能雙塔雙ARGB風扇六導管CPU散熱器 [*]免拆風 ...

PRO Plus 記憶卡 玩家開箱體驗分享活動

您的新選擇 動感生活之選。超快的寫入速度和值得信賴的性能,使用手 ...

打印 上一主題 下一主題

[顯示卡器] AMD談論RDNA 3 GPU和XDNA NPU的AI功能:Radeon RX 7900 XT比Ryzen 7 8700G快8倍

[複製鏈接]| 回復
跳轉到指定樓層
1#
AMD分享了一些有關RDNA 3 GPU和XDNA NPU硬體在以消費者為中心的人工智慧工作負載中的功能的有趣數據。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_2-1456x819.png

毫無疑問,AMD透過在Ryzen APU實施XDNA NPU,在向更廣泛的PC用戶提供AI功能方面一直處於領先地位。第一款NPU於2023年與Phoenix Ryzen 7040 APU一起推出,最近又透過Hawk Point Ryzen 8040系列進行了更新。除了NPU之外,AMD的RDNA 3 GPU架構還整合了大量可以處理這些工作負載的專用AI核心,該公司正試圖透過其ROCm軟體套件來鞏固其勢頭。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_4-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_3-1456x819.png

在最新的與專家會面網路研討會上,AMD討論了RDNA 3系列等Radeon顯示卡如何為遊戲玩家、創作者和開發人員提供一系列優化的工作負載,其中包括:
  • 視訊品質增強
  • 背景噪音消除
  • 文字轉圖像 (GenAI)
  • 大型語言模式 (GenAI)
  • 圖片修改
  • 影片編輯
  • 升級
  • 文字到圖像
  • 模型訓練(Linux)
  • ROCm 平台 (Linux)

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_5.png

從AMD RDNA 3架構開始,Radeon RX 7000 GPU和Ryzen 7000/8000 CPU上配備的最新GPU提供了超過2倍的AI效能提升。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_6.png

這些GPU產品提供多達192個AI加速器,這些加速器針對FP16工作負載進行了優化,在Microsoft DirectML、Nod.AI Shark和ROCm等多個ML框架中進行了優化,並有大型專用VRAM池,這對於處理大型資料集至關重要(高達48GB),並且還有透過Infinity Cache技術提升的更快頻寬。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_7.png

AMD表示PC平台上的大多數AI用例包括LLM和Diffusion模型,這些模型主要依賴所運行硬體的FP16運算和記憶體功能。某些模型(例如SDXL(擴散))受計算限制,需要大約4-16GB記憶體,而Llama2-13B和Mistral-8x 7B受記憶體限制,最多可使用23GB記憶體。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_8.png

如前所述AMD擁有多種有專用AI加速功能的硬體。即使該公司的Radeon RX 7600 XT(售價329美元)也擁有16GB VRAM,在性能方面,它比LM Studio中的Ryzen 7 8700G提升了3.6倍,而RX 7900 XT則比RX 7900 XT快8倍。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_9-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_10-1456x819.png

LM Studio 效能(越高越好):
  • Ryzen 7 8700G NPU: 11 Tokens/second
  • RX 7600 XT 16 GB: 40 Tokens/second
  • RX 7900 XT 20 GB: 85 Tokens/second


AMUSE 擴散(越低越好):
  • Ryzen 7 8700G NPU: 2.6 second/image
  • RX 7600 XT 16 GB: 0.97 second/image
  • RX 7900 XT 20 GB: 0.6 second/image

AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_11.png

AMD也與NVIDIA的GeForce RTX進行了一個小小的比較,NVIDIA團隊稱之為Premium AI PC平台。兩個系列都提供類似的支援,但AMD展示了其16GB GPU的售價較低,為329美元(7600 XT),而NVIDIA最入門級的16GB GPU起價約為500美元(4060 TI 16 GB )。該公司還擁有可擴展至48GB記憶體的高階產品。AMD先前也曾在AI方面以更好的價值展現出與Intel Core Ultra相比的強勁性能。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_22-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_21-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_20-1456x819.png

展望未來,AMD討論了ROCm 6.0的進展情況,以及開源如何獲得對Radeon RX 7900 XTX、7900 XT、7900 GRE、PRO W7900和PRO W7800等消費級硬體的支援。 ROCm 6.0在Ubuntu 22.03.3 (Linux) 作業系統上支援PyTorch和ONNX Runtime ML模型和演算法,並透過為更複雜的模型添加INT8來提高互通性。

該公司還試圖透過為開發人員提供一系列軟體堆疊和硬體文件來使ROCm更加開源。
AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_12-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_13-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_14-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_18-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_19-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_23-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_24-1456x819.png


AMD-Radeon-GPU-Ryzen-XDNA-NPU-AI-PC-Workloads-_25-1456x819.png

AMD及其ROCm正在與主導的NVIDIA CUDA和TensorRT競爭,而Intel也憑藉自己的OneAPI AI取得了進展。這是PC平台上的人工智慧工作負載需要關注的三種力量,因此預計未來現有和下一代硬體將出現大量創新和最佳化。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-5-29 14:38 , Processed in 0.166568 second(s), 33 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表