找回密碼註冊
作者: sxs112.tw
查看: 5609
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [處理器 主機板] NVIDIA解析GB10 Superchip:3nm,20 ARM v9.2 CPU Cores、LPDDR5x-9400 、140W TDP

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2025-8-27 10:08:21 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    NVIDIA剛剛詳細介紹了其搭載Blackwell GPU的GB10 Superchip,該晶片正用於為多台DGX AI Mini超級電腦提供動力。
    2025-08-26_19-58-38.png

    NVIDIA的DGX Spark是首款搭載GB10 Superchip的系統,一直以來備受矚目。該系統標誌著NVIDIA進軍AI PC領域的第一步。自發布以來其他幾家公司也紛紛推出了各自的GB10 AI PC平台。今天在Hot Chips 2025大會上NVIDIA深入探討了其GB10 Superchip,以及它如何將Blackwell架構擴展到Mini開發者和工作站。
    2025-08-26_19-59-06-scaled.png

    DGX Spark背後的想法是設計一台採用Blackwell架構的迷你AI超級電腦。為了實現這一目標,NVIDIA開發了GB10 Superchip,它融合了資料中心的創新技術,例如NVFP4、CUDA、SLANG、TensorRT、vLLM、CX-7 NIC、NVLINK C2C、TMEM等,並整合到一個採用小尺寸的迷你PC平台,該平台採用了多晶片封裝技術、統一記憶體和低尺寸功率的迷你PC平台。
    2025-08-26_19-59-20-scaled.png

    因此DGX Spark 工作站應運而生,它有以下主要功能和優勢:
    • GB10 Grace Blackwell Superchip:加速人工智慧、資料科學、運算、渲染和視覺化
    • 128GB一致性統一系統記憶體:適用於高達2,000億個參數的大型AI模型,可對高達700億個參數的模型進行微調
    • ConnectX-7網路:將兩個DGX Spark系統連接在一起,以使用最多405b個參數的模型
    • DGX Base OS和NVIDIA AI軟體:將工作負載從DGX Spark無縫遷移到DGX Cloud或任何加速資料中心或雲端基礎設施
    • 靈活的部署配置:配置為AI工作站或網路連接的個人AI雲
    • 出色的桌面體驗:多頭顯示器支援和靈活的連接性
    • 小巧、節能的設計:可輕鬆放置在任何桌面上,並由標準壁式插座供電
    • NVIDIA DGX Spark Workstation有強大的AI功能和小巧、高效的設計。

    2025-08-26_19-59-36-scaled.png

    那麼讓我們深入了解GB10 Superchip的規格。首先讓我們來看看SoC的組成,它顯示晶片本身由兩個小晶片組成:一個S-Dielet,用於容納CPU、記憶體系統等;另一個G-Dielet,用於容納GPU核心。這兩個小晶片採用先進的2.5D封裝技術封裝在一起,並採用台積電的3nm製程技術製造。
    2025-08-26_19-59-44-scaled.png

    該CPU採用ARM Arch v9.2架構,共20個核心。共有2個集群,每個集群包含10個核心,每個核心擁有一個私有的L2快取,每個集群還擁有一個16MB的L3快取,因此總共32MB。
    2025-08-26_19-59-53-scaled.png

    該GPU採用GB100 Blackwell架構,由於採用相同的封裝和晶片,因此被視為iGPU。它搭載支援DLSS4的第五代Tensor核心和RTX光線追蹤核心。它可為AI工作負載提供高達31 TFLOP的FP32運算能力和1000 TOPS的NVFP4 (FP4) 運算能力。此外該GPU還額外配備24MB的L2快取。

    說到記憶體系統,NVIDIA GB10 Superchip SOC 支援 256b LPDDR5x (UMA),速度高達 9400 MT/s,從而實現高達 301 GB/s 的原始頻寬和高達 128 GB 的最大容量。系統結構是一種高效能一致性結構,支援 CHI-E 一致性協定。 GPU 可以透過 C2X 介面存取 600 GB/s(聚合)的整個系統頻寬。
    2025-08-26_20-00-10-scaled.png

    此外它還配備了16MB的系統級快取,作為CPU的L4快取,並支援SoC上多個引擎之間高效共享資料。 C2C界面也具備高頻寬和低功耗的特點,這得益於NVIDIA 的NVLINK架構。

    在連接方面,NVIDIA的GB10 Superchip SoC提供PCIe、USB、採用PCIe的乙太網路孔,並支援多達4個並發顯示器(3個DP + 1個HDMI),在DP Alt模式下最高支援4K@120Hz,在HDMI 2.1a解析度模式下最高支援8K@120Hz。安全功能包括雙安全根 (Dual Secure Root) 支援、SROOT處理器、OSROOT處理器,以及對fTPM和獨立TPM的支援。整顆晶片的TDP為 40W。
    2025-08-26_20-00-28-scaled.png

    以下是NVIDIA GB10 Superchip SoC的block diagram:
    2025-08-26_20-00-16-scaled.png

    可擴充性也是GB10 Superchip SoC的另一個亮點。您可以透過NVIDIA的ConnectX 技術連接多個GB10晶片,並擴展吞吐量、頻寬和DRAM容量,以支援更大的 AI型號。 ConnectX NIC使用PCIe Gen5 x8連接到GB10 SoC,各個單元之間透過乙太網路相互通訊。
    2025-08-26_20-00-35-scaled.png

    NVIDIA稱GB10 Superchip SoC是他們與聯發科成功合作的成果,因為其CPU IP就來自聯發科。該晶片經過了廣泛的效能建模,將GPU記憶體導入聯發科的記憶體系統。

    現在GB10 Superchip片如此引人注目的原因在於,我們終有一天會看到它登陸筆記型電腦和Mini PC等消費級平台。先前有報告指出N1X和N1 SoC將成為首批以消費者為中心的NVIDIA SoC,而GB10則讓我們首次得以一窺這些晶片的真正面貌和功能。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-10 08:48 , Processed in 0.072492 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表