找回密碼註冊
作者: kaikai
查看: 4341
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [業界新聞] 吞吐量30倍提升! NVIDIA秀Blackwell性能:打破MLPerf紀錄居第一

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    kaikai 發表於 2025-4-3 13:52:36 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    NVIDIA在官網表示,在最新的MLPerf V5.0基準測試中,NVIDIA的Blackwell平台取得了令人矚目的成就。

    MLPerf是一個衡量人工智慧硬體、軟體和服務效能的標準化基礎測試平台,它由圖靈獎得主大衛·帕特森聯合谷歌、史丹佛、哈佛大學等頂尖企業和學術機構成立,是權威性最大、影響力最廣的國際AI性能基準測試。

    最新更新的MLPerf 新增了Llama 3.1 405B,這是最大且最難運行的開放權重模型之一。

    NVIDIA表示,雖然許多公司在其硬體上執行MLPerf基準測試以衡量效能,但只有NVIDIA及其合作夥伴提交並發布了Llama 3.1 405B基準測試的結果。

    具體來看,GB200 NVL72系統透過連接72個NVIDIA Blackwell GPU,作為一個單一的超大GPU運行,在Llama 3.1 405B基準測試中,與H200 NVL8相比,實現了高達30倍的吞吐量提升。

    據介紹,在生產環境中,推理部署通常受到兩個關鍵指標的延遲限制:首次回應時間(TTFT)和每個輸出令牌的時間(TPOT)。

    新的Llama 2 70B Interactive基準測試將TPOT縮短了5倍,TTFT降低了4.4倍,模擬了更快的使用者體驗。

    在這項測試中,NVIDIA使用8個Blackwell GPU的DGX B200系統,效能比使用8個H200 GPU的系統高出三倍,為這更具挑戰性的Llama 2 70B基準測試設定了新的高標準。

    8113bf4f-41d2-4598-9c75-2b2be05c4f3b.jpg


    來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-24 19:48 , Processed in 0.152166 second(s), 34 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表