Intel的Xe3顯示架構已正式發布,並將應用於Panther Lake的iGPU,未來也將推出Xe3P版本。
去年Intel推出了Xe2架構,並將其整合到兩款客戶端產品中:Lunar Lake Core Ultra 200 CPU(用作iGPU)和Arc B系列Battlemage 獨立顯示卡。由於Intel在Xe1架構和Arc Alchemist A系列產品上的經驗,Xe2在兩個平台上都取得了更大的成功。
該公司在軟體部門也取得了長足進步,為其顯示架構提供了強大的驅動程式支援,不僅限於遊戲,還非常適合內容創作、渲染和AI工作負載。最近推出的Arc Pro 系列也獲得了與Battlemage GPU相同的驅動程式分支的支援。
因此從過去幾個月的情況來看,Intel在顯示處理方面取得了一些實質的更新。架構得到了改進,軟體在優化和利用方面也做得更好。隨著Panther Lake Core Ultra 300系列的發布,新一代Xe架構(代號Xe3)也即將到來。
Intel Xe3是採用Xe2架構打造的,它將顯示卡擴展到更大的配置,並提供吞吐量更優化的設計。關於Xe3的討論內容很多,在此我們還要指出的是Xe3 iGPU將會命名為Arc B系列。
雖然Arc B系列的另一個家族Battlemage dGPU是採用Xe2架構,而Panther Lake iGPU是採用Xe3架構,但Intel表示做出這一決定是因為Xe2和Xe3在某些方面相似,所以他們決定在整合和獨立之間採用單一統一的產品。
話雖如此,Intel確實已經在規劃一個新的Arc系列,它將使用升級版的Xe3 GPU架構Xe3P,據說這是另一個重要的進步。目前尚未公佈更多細節,但看起來Intel不會直接轉向Xe4;相反他們將進一步優化Xe3,以適應未來的產品,無論是整合的還是獨立的。根據shillioute的說法Xe3P似乎可以作為獨立顯示卡方案實現,但它也可以作為Nova Lake CPU的更高階的核心顯示配置,所以我們值得期待。
此外Xe3P GPU將不會像Battlemage dGPU或Panther Lake iGPU那樣包含在Arc B系列中,而是會出現在下一代Arc系列中,那麼Arc C系列呢?了解完這些之後,讓我們繼續了解Xe3的詳細資訊。
Xe3,Intel在新架構上做的第一件事就是擴大渲染切片。 Xe2每個渲染切片配置了4個Xe核心和4個光線追蹤單元。
Xe3將每個渲染切片的Xe核心和光線追蹤單元數量提升至6個。這意味著每個渲染切片的核心數量和光線追蹤單元數量增加了50%。
這使得Intel能夠在其Panther Lake Soc中使用多種GPU模組配置。 8C和16C晶片配備4個Xe GPU,而頂級16C晶片則配備12個Xe GPU。這將是一個有趣的比較,因為Arrow Lake和Lunar Lake都採用各自的Xe1和Xe2架構最多包含8個Xe核心。 Panther Lake在8C和16C產品上使用4個Xe核心,因此數量只有現有產品線的一半,但顯示架構的改進應該能保持競爭力。
現在我們來談談這兩種配置,第一種是4 Xe核心晶片。它有兩種類型:8C採用Intel 3製程技術製造,而16C則採用台積電N3E製程技術製造。細分如下:
- 4 Xe Cores (Xe3 Architecture)
- 1 Render Slice
- 32 XMX Engines
- 4 MB L2 Cache
- 1 Geo Pipeline
- 4 Samplers
- 4 Ray Tracing Units
- 2 Pixel Backends
12 Xe核心iGPU採用台積電N3E製程技術製造。 12 Xe核心配置如下:
- 12 Xe Cores (Xe3 Architecture)
- 2 Render Slices
- 96 XMX Engines
- 16 MB L2 Cache
- 2 Geo Pipelines
- 12 Samplers
- 12 Ray Tracing Units
- 4 Pixel Backends
配備4MB L2快取的4Xe iGPU配置是Lunar Lake Xe2 iGPU(8MB L2)的一半。但頂級12Xe iGPU配置的L2快取是後者的兩倍。快取翻倍有助於減少SoC架構上的流量,使遊戲流量減少高達36%,平均減少25%。
現在我們來談談Xe3架構內實現的架構變化。
第三代Xe核心有八個512位元向量引擎 (XVE)、八個2048位元XMX引擎和+33%共用 L1/SLM快取。
Xe向量引擎現已提升Xe3架構的利用率,線程數量增加高達25%,並支援可變寄存器分配和FP8去量化。它由SIMD16原生ALU、3路協同發射、擴展數學和FP64模組以及Xe矩陣擴展組成。
Xe3 XMX引擎負責AI加速。 12Xe iGPU配備多達96個XMX引擎,能夠提供高達120 TOPs的運算能力。依照這個計算方式,4Xe iGPU最多可以提供40 TOPs。採用Xe2架構的8Xe iGPU則能夠提供高達67 TOPs的運算能力。使用相同的運算方法,配備8Xe核心的Xe3 iGPU能夠提供67 TOPs的AI運算能力,提升25%。
Intel還採用了全新的增強型光線追蹤單元,該單元有用於非同步光線追蹤的動態光線管理功能。此光線追蹤單元包含多個管線、兩個三角形相交單元和一個BVH快取。改進之處在於光線在流水線的移動方式。這是透過減慢新光線的調度速度來實現的,以防止它們在流水線中移動時出現擁塞。
另一項重大改進是全新的URB管理器,它允許部分更新,而無需全部更新。 URB是在GPU內部傳遞結果的結構。新架構還有高達2倍的各向異性過濾和高達2倍的模板測試速率。
最後在媒體方面,Intel擁有AV1編碼/解碼、VVC解碼以及對eDP 1.5技術的支援。所有這些特性共同成就了Panther Lake的Xe3顯示卡。此外一些新增功能包括 AVC 10位元支援以及Sony XAVC-H、XAVC-HS和 AVC-S支援。
Intel Xe3 iGPU看起來是現有Xe2架構的堅實升級。 Xe2架構目前與主流筆記型電腦中最快的RDNA 3.5 iGPU(例如Radeon 890M 和 880M)相當。雖然它不一定能達到搭載更大RDNA 3.5的高階Strix Halo的性能水平,但Intel與NVIDIA近期的客製化SoC合作似乎將涵蓋這一領域。
消息來源 |