找回密碼註冊
作者: sxs112.tw
查看: 8955
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [顯示卡器] NVIDIA GeForce Ada Lovelace GPU SM Block Diagram曝光:遊戲GPU比以往更大更好!

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2022-5-14 14:26:46 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    有關將為GeForce RTX 40系列顯示卡提供動力的NVIDIA Ada Lovelace遊戲GPU的詳細訊息已被披露。新訊息來自Kopte7kimi&並談論下一代架構的Block Diagram。
    2022-05-14_7-23-25-very_compressed-scale-2_00x-Custom-2060x803.png

    從GPU配置開始,Kopite7kimi將頂級AD102 GPU與NVIDIA的其他各種GPU進行了比較。其中包括專注於遊戲的Ampere GA102和Turing TU102,同時還添加了專注於HPC的Hopper GH100和Ampere GA100。
    NVIDIA-Ada-Lovelace-GPU-Block-Diagram-For-GeForce-RTX-40-Series-Gaming-Graphics-.jpg

    NVIDIA Ada Lovelace AD102 GPU將配備多達12個GPC(顯示處理集群)。這與僅有7個GPC的GA102相比增加了70%。每個GPU將由6個TPC和2個SM組成,與現有晶片的配置相同。每個SM(Streaming Multiprocessor)將容納四個子核心,這也與GA102 GPU相同。改變的是FP32和INT32核心配置。每個子核心將包括 128個FP32 單元,但組合的FP32+INT32單元將達到192個。這是因為FP32單元與IN32單元不共享相同的子核心。128個FP32核心與64個INT32核心是分開的。
    未命名.png

    所以總括來說每個子核心將由128個FP32加上64個INT32單元組成,總共192個單元。每個SM將總共有512個FP32單元加上256個INT32單元,總共768個單元。由於總共有24個SM單元(每個GPC 2個),我們正在看到12,288個FP32單元和6,144個INT32單元,總共18,432個核心。每個SM還將包括兩個Wrap Schedules(32 線程/CLK),每個SM有64個wrap。與GA102 GPU相比,核心 (FP32+INT32) 增加了50%,Wraps/Threads增加了33%。

    轉到快取,這是NVIDIA對現有Ampere GPU的另一個重大改進。Ada Lovelace GPU將為每個SM打包192KB的L1,比Ampere增加50%。在頂級AD102 GPU上總共有4.5MB的L1。如洩漏中所述L2將增加到96MB。這比僅有6MB L2的Ampere GPU增加了16倍。快取將在GPU之間共享。

    最後每個GPC的ROP也增加到32個,比Ampere增加了2倍。您在下一代旗艦產品上看到的ROP高達384個,而在最快的Ampere GPU RTX 3090 Ti上僅為112個。Ada Lovelace GPU上還將注入最新的第4代Tensor和第3代 RT(光線追蹤)核心,這將有助於將DLSS和光線追蹤性能提升到一個新的水平。總體而言Ada Lovelace AD102 GPU將提供:

    • 2x GPC(與Ampere相比)
    • 增加50%的核心(相對於Ampere)
    • 多出50%的L1(與Ampere 相比)
    • 16倍以上的 L2(與Ampere 相比)
    • 將ROP翻倍(與Ampere相比)
    • 第4代Tensor核心和第3代RT核心


    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-26 02:08 , Processed in 0.354778 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表