NVIDIA出乎意料地推出了相當新款的AI GPU,其特色是Rubin CPX AI晶片,與機架規模集群結合時可提供強大的推理能力。
NVIDIA團隊意識到人工智慧推理可能是運算能力的下一個重點領域,該公司現已宣布推出CFX系列下的全新人工智慧晶片,Rubin系列將率先亮相。在人工智慧基礎架構高峰會上,NVIDIA團隊發布了Rubin CPX GPU,該GPU針對長情境人工智慧,更重要的是它將與Rubin GPU和Vera CPU共存。 NVIDIA聲稱這款晶片將在高效執行人工智慧推理方面帶來一場革命。
規格方面,Rubin CPX擁有30 PetaFLOP的NVFP4運算能力和128GB的GDDR7,並將搭載於獨家NVIDIA Vera Rubin NVL144 CPX機架。此機架整合144個Rubin CPX GPU、144個Rubin GPU和36個Vera CPU,可提供8 ExaFLOP的NVFP4運算能力。僅此一項,其NVFP4運算能力就比Blackwell Ultra高出7.5倍。借助Spectrum-X乙太網路等技術,NVIDIA計劃提供高達百萬級令牌上下文AI推理工作負載,並將效能提升至新的水平。
該平台據稱可實現30倍至50倍的投資回報率,而Vera Rubin NVL144 CPX機架將打破打造下一代生成式AI應用中存在的計算障礙。 Rubin CPX也將提供其他配置,但具體配置尚未公佈。然而考慮到整合的是GDDR7記憶體而非HBM,該晶片被視為一種相對低成本的解決方案。
NVIDIA團隊涵蓋了AI產業的各個角落,讓競爭對手幾乎沒有超越的空間。 NVIDIA現已迅速轉型,專注於推理技術。隨著下一代Rubin AI產品線明年的發布,我們有望見證運算能力的巨大飛躍。
消息來源 |