NVIDIA在OCP上宣布了其AI計算產品組合的幾項重要更新,包括圍繞其Kyber機架規模一代的開發,這是一項重大進步。
隨著世界對運算能力的需求日益增長,NVIDIA在其整個技術堆疊中不斷取得進展,競爭對手在競爭中幾乎沒有追趕空間。如今在OCP全球高峰會上,NVIDIA團隊展示了AI工廠的未來。該公司透露了一些有趣的進展,其中最樂觀的進展之一包括圍繞下一代Kyber機架級技術開展的工作,該技術將取代Oberon,並有可能使該公司擴展到大規模的NVL576配置。
OCP生態系統也正在為NVIDIA Kyber做準備,其特色在於800 VDC供電、液冷和機械設計方面的創新。這些創新將支援NVIDIA Kyber向機架伺服器的轉型——NVIDIA Oberon的繼任者——到2027年,該伺服器將搭載576個NVIDIA Rubin Ultra GPU的高密度平台。
——NVIDIA
如果您對正在討論的主題還不熟悉,Kyber和Oberon指的是機架式架構,其主要涉及晶片排列、功率等級和散熱解決方案。 Oberon一直是NVIDIA Blackwell系列(GB200/GB300)的主導設計,但隨著Rubin Ultra的推出,NVIDIA計劃過渡到Kyber系列,這將帶來多項升級。其中一個核心改進領域是機架架構,NVIDIA將改用堆疊式運算托盤,這種托盤垂直安裝,類似於書籍,稱為垂直刀片。
這項技術將帶來更高的GPU密度和更有效率的網路。另一個值得關注的升級是在同一機架內內建NVLink交換器刀片,這將提高可擴展性並簡化機架維護。在性能方面,Kyber的一大關鍵優勢是NVIDIA將改用800 VDC設施到機架供電模式,這也是對先前415或480 VAC三相系統的升級。
這將顯著提高能效,更重要的是透過同一根銅線傳輸的功率可提高150%,從而透過減少部署大規模集群所需的銅線數量,節省數百萬美元。總而言之Kyber將為 NVIDIA的Rubin Ultra NVL576系統鋪平道路,帶來前所未有的運算能力,並推動尖端AI基礎架構的競爭。
消息來源 |