找回密碼註冊
作者: sxs112.tw
查看: 8238
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [顯示卡器] NVIDIA表示Hopper上的第4代Tensor核心在同一時脈下可提供2倍的性能。

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2022-8-22 21:31:42 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    NVIDIA在Hot Chips 34上進一步剖析其Hopper H100 GPU,讓我們體驗第四代Tensor核心架構所提供的功能。
    NVIDIA-Hopper-H100-GPU.png

    雖然AMD在其HPC GPU上採用MCM方法,但NVIDIA決定暫時堅持單Die設計。因此他們的Hopper H100是使用台積電4N製程製造的最大GPU之一,該設計專為 NVIDIA進行了優化和製造。
    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_1-1480x833.png


    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_2-1480x783.png


    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_3-1480x830.png


    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_4-1480x835.png


    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_5-1480x830.png


    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_6-1480x820.png

    H100 GPU是一款怪獸級晶片,採用最新的4nm技術,並結合了800億個電晶體管以及最先進的HBM3技術。H100採用PG520 PCB板打造,該板有30多個電源 VRM和一個使用TSMC的CoWoS技術將Hopper H100 GPU與6堆棧HBM3設計相結合的大型整合中介層。Hopper H100 GPU的一些主要技術包括:
    • 132 SMs (2x Performance Per Clock)
    • 4th Gen Tensor Cores
    • Thread Block Clusters
    • 2nd Gen Multi-Instance GPU
    • Confidential Computing
    • PCIe Gen 5.0 Interface
    • World's First HBM3 DRAM
    • Larger 50 MB L2 Cache
    • 4th Gen NVLink (900 GB/s Total Bandwidth)
    • New SHARP support
    • NVLink Network

    在六個堆棧中,保留兩個堆棧以確保良率完整性。但是新的HBM3標準允許以3TB/s的速度提供高達80GB的容量。相比之下目前最快的遊戲顯示卡RTX 3090 Ti僅提供1TB/s的頻寬和24GB的VRAM 容量。除此之外H100 Hopper GPU還採用最新的FP8格式,透過其新的SXM連接,它有助於對應晶片設計的700W電源設計。它還提供兩倍的FP32和FP64 FMA速率和256 KB L1高速快取(共享記憶體)。


    因此按照規格NVIDIA Hopper GH100 GPU由一個巨大的144SM(處理器)晶片佈局組成,總共有8個GPC。這些GPC共有9個TPC,每個TPC進一步由2個SM單元組成。這使我們每個GPC有18個SM,而在完整的8個GPC配置中,我們有144個。每個SM最多由128個FP32單元組成,這應該給我們總共18,432個CUDA核心。
    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8.png

    這比完整的GA100 GPU配置增加了2.25倍。NVIDIA還在其Hopper GPU中利用了更多的FP64、FP16和Tensor核心,這將極大地提高性能。這將是與Intel的Ponte Vecchio競爭的必要條件,後者也有望採用1:1 FP64。NVIDIA表示Hopper上的第4代Tensor核心在同一時脈下可提供2倍的性能。

    另一個有趣的比較指出了GPU擴展,Hopper H100 GPU上的單個GPC相當於Kepler GK110 GPU,這是2012年的旗艦HPC晶片。Kepler GK110總共包含15個SM,而Hopper H110 GPU包含132個SM甚至Hopper GPU上的單個GPC也有18個SM,比Kepler旗艦上的全部SM多20%。
    NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7.png


    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-25 18:05 , Processed in 0.224359 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表