找回密碼註冊
作者: lin.sinchen
查看: 5251
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

Uniface RGB機殼 玩家體驗分享活動

性能即是一切 與 Uniface RGB 中塔機箱探索效益和性能的完美平衡, ...

T5 EVO 移動固態硬碟 玩家體驗分享活動

自信無懼 生活帶著你遨遊四方。高性能的 T5 EVO 在工作、創作、學習 ...

ZOTAC 40 SUPER顯示卡 玩家開箱體驗活動 --

頭獎 dwi0342 https://www.xfastest.com/thread-286366-1-1.html ...

FSP VITA GM 玩家開箱體驗分享活動

[*]符合最新 Intel ® ATX 3.1電源設計規範 [*]遵從 ATX 3.1 推薦 ...

打印 上一主題 下一主題

[顯示卡器] AMD 搶先挺進 7nm GPU 與 PCIe 4.0 發表 Radeon Instinct MI60 運算加速卡

[複製鏈接]| 回復
跳轉到指定樓層
1#


AMD「Next Horizon」活動中,不僅揭曉 7nm Zen 2 “ROME” EPYC 處理器,更搶先挺進 7nm 製程 GPU 與 PCIe 4.0 規格,發表首款 Radeon Instinct MI60 與 MI50 運算加速卡。


Vega 架構優化 7nm 製程  Radeon Instinct MI60 運算加速卡

AMD 如期推出 Vega 架構優化並採用 7nm 製程的 GPU「Radeon Instinct MI60」運算加速卡,新製程與架構優化,讓 GPU 電晶體密度提高 2 倍,更有著 1.25 倍的性能提升,以及更高的每瓦效能。






MI60 著重於「FP64」與「FP32」加速運算,可加速深度學習所需的 Training 與 Inference 運算;以及 32GB HBM2 記憶體,不僅可達到 1TB/s 記憶體頻寬速度,更具備 End-to-End ECC 保護。

而 MI60 除了是首款 7nm GPU 之外,更是首款支援 PCIe 4.0 的繪圖處理器;而多 GPU 之間通過 Infinity Fabric 橋接,可達到 100GB/s per Link 的連接頻寬,而受惠於 PCIe 4.0 可讓 GPU 與 CPU 之間達到雙向 Bi-Directional 64GB/s 的頻寬;更支援硬體層級的 GPU 虛擬化技術。










性能方面,MI60 在一般運算如「雙精度矩陣乘法(DGEMM)」比起上一代 MI25 有著 8.8 倍的性能提升,達到 6.717 TFLOPS;而深度學習 Resnet-5o 的影像辨識速度,MI60 可達到每秒 498 張,更是 MI25 的 2.8 倍性能提升。

而且在 Resnet-5o 深度學習訓練上,有著近乎倍數的多 GPU 性能提升,2 GPU 有著 1.99 倍性能提升,8 GPU 更可保持在 7.64 倍的訓練性能提升。








至於 MI60 與對手 Tesla V100 相互比較,雙精度矩陣乘法(DGEMM),MI60 有著 6.717 TFLOPS 快過 V100 的 6.627 TFLOPS;至於單精度矩陣乘法(SGEMM),MI60 有著 14 TFLOPS 運算能力,亦贏過 V100 的 13.1 TFLOPS;只不過,在 Resnet-5o 深度學習訓練上,MI60 僅每秒 334 張的處理速度,緊追在 V100 每秒 357 張的性能之後。






簡單來說 Radeon Instinct MI60 是世界首款 7nm GPU 產品,以及第一款支援 PCIe 4.0 的運算加速卡,更達到 1TB/s 記憶體頻寬速度,以及硬體層級虛擬化。
針對 HPC 有著 7.4 TFLOPS FP64 的性能,對於深度學習的 Training 有著 14.7 TFLOPS FP 32 的性能,至於深度學習 Inference 有著 118 TOPS INT4 的性能表現。







更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-5-5 06:11 , Processed in 0.099545 second(s), 36 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表