AMD對消費級GPU領域的未來有著宏偉的計劃,而且這些計劃並不普通,因為根據傳言和新專利,該公司預計很快就會採用Multi-Chiplet GPU。
MCM(多晶片模組)的概念對於圖形處理領域來說並不新鮮,但由於單晶片設計的局限性,業界對MCM的傾向無疑正在增長。 AMD似乎是多晶片設計方面經驗豐富的公司之一,因為他們的Instinct MI200 AI加速器系列是第一個採用MCM設計的加速器,該設計將多個晶片堆疊在一個封裝上,例如GPC(圖形處理核心)、HBM和I/O晶片。據coreteks稱AMD的Instinct MI350系列採用了相當新穎的方法,這可能成為消費級GPU的基礎。
現在在遊戲GPU上採用Chiplet設計的最大限制是更高的延遲,因為FPS無法容忍長距離數據跳躍。為了解決這個問題,AMD必須找到一個解決方案,盡可能地彌合資料和計算之間的差距。根據影片中揭露的一份新專利申請,AMD可能已經破解了Multi-Chiplet遊戲GPU的關鍵。有趣的是該專利披露了CPU而非GPU的細節,但其文字和機製表明,它的目標是用於顯示。
那麼AMD究竟會如何將多晶片設計應用於GPU呢?該專利中的主要驅動力據稱是一種“帶有智慧交換機的數據結構電路”,用於橋接計算晶片和記憶體控制器之間的通訊。它本質上是AMD的Infinity Fabric,但由於AMD無法使用HBM記憶體晶片,因此針對消費級GPU進行了縮減。該交換器旨在透過首先比較顯示任務請求是否需要任務遷移或資料複製來優化記憶體訪問,並有ns級的決策延遲。
既然資料存取問題已經解決,該專利建議將GCD設定為L1和L2快取,類似於AI加速器的做法。此外可以透過連接所有GCD的交換器存取額外的共用L3(或堆疊 SRAM)。這將減少存取全域記憶體的需求,更重要的是它可以充當晶片組之間的共享暫存區,類似於AMD的3D V-Cache,只不過它主要用於處理器。此外還涉及堆疊DRAM,這實際上是MCM設計的基礎。
這次多晶片專利的出現,意味著AMD已基本做好了生態系統的準備。該公司可以使用台積電的InFO-RDL橋接器以及特定版本的Infinity Fabric晶片進行封裝。更引人注目的是它是一款縮小版的AI加速器。如果你還記得的話AMD計劃將其遊戲和AI架構合併到一個單元中——UDNA架構。 AMD也整合了軟體生態系統,AMD可以分攤驅動程式和編譯器的工作量。
由於單片設計的局限性,產業亟需變革,而AMD或許擁有在此領域領先競爭對手的最佳機會之一。然而Chiplet設計也存在一些複雜之處,AMD在RDNA3中就遇到了其中之一,原因在於Chiplet互連帶來的延遲。不過憑藉創新的交換方法,結合額外的共享L3,AMD團隊希望能夠解決延遲問題;然而這是一個巨大的架構飛躍。
消息來源 |