根據財星雜誌官網近日報導稱主要針對人工智慧(AI)推理任務應用的晶圓級AI晶片廠商Cerebras Systems宣布,其旗下晶圓級AI晶片(應該是指WSE-3)執行700億個參數的DeepSeek-R1中型模型的速度,比目前最快的GPU還要快57倍。
Cerebras Systems CEO Andrew Feldman受訪時表示企業客戶對中國AI大模型廠商DeepSeek最新推出的R1推理模型極為熱情。他說DeepSeek-R1發布十天後,我們迎接了暴增的需求。
根據官方資料顯示WSE-3仍是採用了一整張12吋晶圓來製作,採用台積電5nm製程,晶片面積為46225mm2,擁有的電晶體管數量達到了4兆個,擁有90萬個AI核心,44GB On Die SRAM,整體的記憶體頻寬為21PB/s,結構頻寬高達214PB/s。讓WSE-3有125 FP16 PetaFLOPS的峰值性能,相比上一代的WSE-2提升了1倍。
DeepSeek-R1推理模型以極低訓練成本,就獲得了性能媲美OpenAI 等競爭對手的最先進的推理模型的性能,對現有技術路線有顛覆性,並且DeepSeek還將該模型進行了開源,這也使得全球的科技廠商都能夠快速利用該模型來建立自己的AI應用,相關AI晶片廠商也能夠快速的針對該模型進行對應和優化,以充分利用AI晶片的性能,即便是NVIDIA AI GPU以外的AI晶片也能從中獲益。
為示範Cerebras的AI伺服器執行DeepSeek-R1速度,Andrew Feldman現場指示模型以Python語言撰寫國際象棋遊戲,只花1.5秒便可完成,相比之下OpenAI最新發布的o1-mini 推理模型卻要花22秒才能用傳統GPU完成相同任務。但因OpenAI模型屬封閉系統,無法直接在Cerebras硬體測試,故難完全對等的進行比較。
消息來源 |