Intel披露了其下一代Xeon 6+ E-core CPU系列(代號為Clearwater Forest)的更多細節,該系列擁有多達288個下一代核心。
Intel最新推出的E-Core Xeon CPU產品Sierra Forest帶來了更高的運算密度和每瓦效能提升。這也是Intel首次將其Xeon產品線細分為P-Core和E-Core系列。
現在旅程仍在繼續,第二代E-Core系列代號為Clearwater Forest,將成為Xeon 6+系列的一部分。
憑藉Clearwater Forest,Intel將其分解式架構和封裝設計提升到了一個新的高度。該晶片採用多層解決方案,包含多個晶片組和構建模組,這使其成為Intel的一項重大工程成就。
一顆Clearwater Forest或Xeon 6+ CPU由12個採用2.5D封裝的EMIB模組組成。這些模組將三個活動基礎模組連接在一起,然後連接到兩個I/O模組和總共12個運算模組。 I/O模組採用Intel 7製程,活動基礎模組採用Intel 3製程,計算晶片組則以Intel 18A製程製造。
說到運算晶片,這些Darkmont E-Core晶片採用帶有RibbonFET 的 18A製程技術製造。Intel聲稱18A透過更低的閘極電容為核心邏輯提供最佳的電源效率。 18A 還提供更高的單元密度和超過90%的單元利用率,同時透過背面的電源軌改進了訊號佈線。 18A還能實現低損耗供電,將損耗降低 4-5%。
深入研究18A的RibbonFET技術,這可以實現更強大的電流控制並降低功耗,從而顯著提升性能。 RibbonFET的閘極環繞電晶體通道,從而能夠嚴格控制通道中的電流,從而實現更大的驅動力和更少的功耗。這也有助於降低工作電壓。此外RibbonFET的閘極長度比FinFET短5-10%,每個電晶體的功耗降低了20%。
RibbonFET的一些功能包括:
- 晶片元件的進一步小型化對於高密度CPU至關重要
- 嚴格控制電晶體通道中的電流
- 提高性能/瓦特、(Vmin)操作和靜電
- 透過色帶寬度和多種閾值電壓類型進行調整
然後是PowerVia,它將標準單元利用率提高高達10%,ISO功耗效能提高高達4%。 PowerVia讓Intel從矽片下方(或某種意義上的背面供電)供電。
PowerVia的一些亮點包括:
- 減少擁堵並提高效能
- 重新安置球場金屬
- 晶片背面的凸塊
- 奈米級TSV實現高效配電
- 改進的訊號路由
- 更高的細胞密度-細胞利用率超過90%
Clearwater Forest也是首款採用Foveros Direct3D技術的量產CPU。 Foveros Direct 3D是一種先進的封裝解決方案,可在基礎主動模組上將運算模組和IO模組連接在一起。 Foveros Direct 3D的凸塊間距為9um,並採用銅對銅鍵結技術。它可作為高密度、低電阻的主動矽中介層,性能約為 0.05pJ/bit。這意味著英特爾幾乎無需消耗任何功耗即可在兩個晶片之間傳輸資料。
以下是Clearwater Forest Xeon 6+ CPU的3D構造概覽:
剖析Clearwater Forest的三個主要板塊
接下來我們來看看三個主要Tile的功能。同樣有三個Tile:計算Tile、I/O Tile和基礎Tile。
Clearwater Forest I/O Tile
Clearwater Forest IO Tile採用Intel 7製程技術製造。該Tile包含兩個封裝,共計八個加速器,提供Intel快速輔助技術、Intel動態負載平衡器、Intel資料流加速器和Intel記憶體分析加速器。兩個I/O Tile共16個加速器。
每個I/O Tile也提供48條PCIe Gen 5.0通道(共96條)、32條CXL 2.0通道(共64條)和96條UPI 2.0通道(共192條)。 IO Tile與Granite Rapids相同,但比 Sierra Forest明顯升級。
Clearwater Forest Base Tile
接下來是基礎模組 (Base Tile),使用EMIB連接,EMIB連接到其上方的計算模組 (Compute Tile)。共有三個基礎模組 (Base Tile) 採用Intel 3製程技術製造。每個基礎模組 (Base Tile) 搭載四個DDR5記憶體控制器,晶片上總共有12個記憶體通道。此模組還包含一個共享LLC,每個計算模組 (Compute Tile) 48MB,每個基礎模組 (Base Tile) 192MB。這提供了高達576MB的封裝內LLC容量。
Clearwater Forest Compute Tile
Clearwater Forest上的計算塊可能是該晶片上最有趣的部分,因為它們採用全新的18A製程技術。每個計算區塊由6個模組組成,每個模組包含4個Darkmont E-Core。這樣每個計算區塊就有24個Darkmont E-Core,12個計算區塊上共有288個E-Core。
每個模組還包含4MB的L2,這意味著每個計算區塊擁有24MB的L2,12個計算區塊總共擁有288MB的L2快取。這與Sierra Forest E-Core CPU相同,整個晶片的 L3+L2快取總計為864MB。
因此您有以下內容:
- 12x Compute Tiles (Intel 18A)
- 3x Active Base Tiles (Intel 3)
- 2x Intel I/O Tiles (Intel 7)
- 12x EMIB Tiles (EMIB 2.5D)
現在讓我們來談談Darkmont E-Core,它也已用於Panther Lake客戶端CPU。
這個核心與我們在Lunar Lake和Arrow Lake CPU上看到的Skymont架構非常相似,但與Crestmont相比,它是一個很大的升級。
從細節開始看,Skymont配備了更新的128位元組預測區塊、更快的尋找下一個指令以及用於並行提取的96個指令位元組。 Darkmont採用9寬微架構,並有更寬的解碼能力,包括9寬(3x3)或比Crestmont E-Core多50%的解碼簇、可解鎖每個簇微碼並行性的Nanocode,以及從64個條目增加到96個條目的Uop隊列容量。此外它還配備了更大的64KB指令快取以及精確且增強的分支預測功能。
在前端(OOE,即亂序引擎),我們正在看到8寬的分配和16寬的退出,這意味著可以更快地添加和清除資源。佇列也獲得了更多資源,亂序視窗現在已擴展到 416個條目。
調度連接埠已增加到26個。標量引擎獲得8個整數ALU、3個載入和4個儲存AGU端口、3個跳轉端口、2個整數儲存資料端口,向量引擎獲得4個向量/浮點ALU、2 個向量/浮點儲存資料、4個向量/浮點堆疊。
記憶體系統增強功能全面提升,L2快取為每四核心集群4MB L2,頻寬翻倍,從64B增加到128B/週期,L1到L1的傳輸速度更快,並提供更可預測的通訊。
這是透過消除從架構傳輸數據,而是透過L1快取傳輸到L2快取來實現的。Conviction Clock已從每個Clock 16位元組升級到32位元組。
以下是Crestmont和Darkmont E-Core架構的比較:
綜合起來Clearwater Forest上的Darkmont E-Core比144核心Xeon 6780E Sierra Forest CPU效能高出90%,在整個負載線上效率提高23%,伺服器整合率高達 8:1,整體擁有成本更低。
Intel也分享了Clearwater Forest Xeon 6+ CPU的一些效能指標。對比對象包括擁有144個核心的Xeon 6700E Sierra Forest 晶片,以及尚未發布的擁有288個核心的Xeon 6900E Sierra Forest晶片。
與330W的144核心Sierra Forest(Xeon 6780E)相比,有288個核心和450W TDP的Clearwater Forest晶片的TDP降低了36.3%,核心數量增加了一倍,性能提高了112.7%,每瓦性能提高了54.7%。
與288核心、500W的Sierra Forest晶片相比,有288個核心和450W TDP的Clearwater Forest晶片的運行TDP降低了11%,但性能提高了17%,每瓦性能提高了 30%。
效能提升得益於全新的 Darkmont E-Core,其IPC提升了17%。與老舊的Xeon平台相比,Clearwater Forest憑藉這些核心,效能提升了1.9倍,效率提升了 23%,伺服器整合率也提升了8:1。
現在來看看平台細節,Intel Clearwater Forest Xeon 6+ CPU將支援LGA 7529插槽的1S和2S配置。這與Xeon 6900P Granite Rapids-AP CPU使用的插槽相同。 Sierra Forest的288核心版本也使用相同的插槽,但這些版本已被取消。這些晶片的額定TDP為300-500W,與Xeon 6700E和6900P CPU的運作範圍相同。較低的TDP規格也意味著核心數量只有Xeon 6700E的一半,例如144個。
該晶片將支援高達12通道DDR5,速度高達8000MT/s。此外該平台還將支援多達6條UPI 2.0連結(每通道高達24GT/s)、多達96條PCIe Gen5.0通道(x16、x8、x4、x2)以及多達64條CXL 2.0通道。
安全功能將包括Intel軟體防護擴充 (SGX) 和Intel信任域擴充 (TDX)。在電源管理方面,這些晶片將搭載Intel AET(應用能耗遙測)和Intel Turbo速率限制器。最後Clearwater Forest CPU將獲得Advanced Vector Extensions 2,並支援VNNI和INT8。
Intel的Clearwater Forest Xeon 6+ CPU預計將於2026年下半年推出,因此我們可以期待在稍晚分享更多資訊和效能指標。
消息來源 |