找回密碼註冊
作者: sxs112.tw
查看: 14538
回復: 0

文章標籤:

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

Uniface RGB機殼 玩家體驗分享活動

性能即是一切 與 Uniface RGB 中塔機箱探索效益和性能的完美平衡, ...

T5 EVO 移動固態硬碟 玩家體驗分享活動

自信無懼 生活帶著你遨遊四方。高性能的 T5 EVO 在工作、創作、學習 ...

ZOTAC 40 SUPER顯示卡 玩家開箱體驗活動 --

頭獎 dwi0342 https://www.xfastest.com/thread-286366-1-1.html ...

FSP VITA GM 玩家開箱體驗分享活動

[*]符合最新 Intel ® ATX 3.1電源設計規範 [*]遵從 ATX 3.1 推薦 ...

打印 上一主題 下一主題

[顯示卡器] NVIDIA公開Volta顯示卡秘密:完整版5376個核心,效能提升50%

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2017-6-20 14:48:45 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AND將在8月初發布RX Vega遊戲顯示卡,也將重返高性能顯示卡市場,但是Vega這次面對的對手不只是16nm Pascal顯示卡,還有NVIDIA新一代12nm FFN製程的Volta顯示卡。今年5月份NVIDIA率先發布了Tesla V100加速卡,用的是GV100大核心,遊戲市場的Volta顯示卡問世只是時間問題,它不會像Vega顯示卡那樣難產。今天NVIDIA又公開了Volta核心的架構秘密,確認了Volta完整版核心是84組SM單元,總計5376個CUDA核心,而且SM單元效能比Pascal這一代提升50%,而現在的GV100大核心只啟用了80組SM單元,5120個CUDA核心,NVIDIA還留有殺手鐧。
volta-03.jpg

NVIDIA正式確認了完整版Volta顯示卡是84組SM單元,每個SM單元有64組FP32浮點單元、64組INT32整數單元、32組FP64雙精度浮點單元、8個Tensor單元(用於深度學習)、4個紋理單元,外加8組512bit顯示記憶體控制器,每個HBM 2堆棧搭配2組顯示記憶體控制器,總計有5376個CUDA核心(FP32、 INT32)、2688個FP64單元、336個紋理單元、672個Tensor單元,還有4096bit等效頻寬、16GB HBM 2顯示記憶體,頻寬900GB/s。
volta-01.jpg

NVIDIA的Volta顯示卡使用了TSMC與NVIDIA定制的12nm FFN製程,而TSMC的12nm製程實際上也是採用目前16nm製程改良的,主要優化了效能、核心面積,性能比16nm FFC製程提升10%,但是核心面積可縮減20%。即便如此,GV100大核心的面積依然從目前的610mm2增加到了815mm2,主要原因就是SM單元數量大增,從60組SM單元增加到了84組。根據NVIDIA的白皮書介紹,Volta架構的SM單元做了大幅改進,新的SM單元效能比Pascal這代提升50%,因此才能在同樣的功耗封裝下大幅提升FP32/FP64計算性能。
volta-02.jpg

當然,NVIDIA在Volta顯示卡上的重點除了提升傳統的FP32/FP64計算性能之外,最重要的還是提升深度計算性能,為此增加了專用的計算單元,每組SM單元有8個Tensor單元,總計640個Tensor單元,Tensor性能可達120TFLOPS,是Pascal這代的12倍多。不過現在的GV100大核心很有可能跟去年的GP100大核心一樣專用於計算市場,真正對遊戲玩家有影響的還是後面的GV102核心,NVIDIA勢必要做些精簡,比如砍掉對遊戲沒用的Tensor單元,減少L2快取,HBM 2顯示記憶體也沒必要,SM單元很有可能也會重組,可以預見遊戲用的GV102核心會進一步降低效能,不過CUDA核心總數相比Pascal也會大幅提升,遊戲性能再上一個台階。

消息來源
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-4-26 04:53 , Processed in 0.370948 second(s), 67 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表