本帖最後由 as89725671 於 2026-6-26 13:20 編輯
人工智慧巨頭 OpenAI 近日宣布,推出全新自研的AI 推理晶片「Jalapeño」;是款由 OpenAI 內部團隊主導,與通訊晶片大廠博通(Broadcom)合作開發的特殊應用晶片(ASIC),專為 AI 服務應用的大型語言模型(LLM)推理加速;此舉說明 OpenAI 在建立模型、產品到硬體底層的「全端戰略」上邁出關鍵一步,更展現了其擺脫單一硬體供應商依賴的決心。
專攻 LLM 推理優化:與 Google TPU 互別苗頭
Jalapeño 推理晶片,內部整合了固定功能與可程式化(Programmable)的運算單元,具備有效支援 OpenAI 旗下模型的運算潛力,未來將全面支援 ChatGPT、Codex、OpenAI API ,以及未來各類基於 AI 代理的核心產品。
從架構概念來看,Jalapeño 與 Google 的 TPU 具備相似的戰略定位,皆是為自家技術與模型,量身訂製的專屬硬體;不過有別於 TPU 兼顧訓練與推理,Jalapeño 目前顯然完全專注於邊緣運算與雲端的「推理」工作,至於極耗資源的模型訓練任務,預計仍交由 GPU 負責。
OpenAI 表示,Jalapeño 是該公司與博通計畫打造的跨世代運算平台中,是本家首款 AI 推理晶片;其核心願景是讓先進的 AI 服務變得更快、更穩定且更具成本效益,貼合當前與未來 LLM 架構的運算特性;值得一提的是,在 OpenAI 自身 AI 模型輔助硬體設計的加持下,Jalapeño 從初期設計到最終下片生產(Tape-out)僅耗時短短 9 個月;並且在每瓦效能(Performance-per-watt)表現,可大幅超越目前市場同級硬體。
展望未來,Jalapeño 晶片將與各大資料中心夥伴展開深度合作,以吉瓦(GW)級的宏大基礎設施規模進行跨世代部署;OpenAI 企圖將這股自研晶片動能,全面延伸至旗下的全端平台,實現從終端產品、底層 AI 模型、再到矽晶圓晶片的垂直整合生態系。
|