sxs112.tw 發表於 2024-12-21 21:45:42

OpenAI最強推理模型o3發布:AGI能力暴漲,接近人類水平

OpenAI連續12日聖誕節發布終於迎來激動人心的大結局,OpenAI推出重大新品,其迄今最強前端推理模型的升級版——o3。OpenAI號稱o3在某些條件下接近通用人工智慧(AGI),共有o3和精簡版o3-mini兩個版本。

評估顯示o3在軟體工程測試中準確率比o1高近47%,競賽數學評量的準確率比o1高15%,人類博士專家級生化物測試中準確率比o1高近13%。在AGI相關測驗中,o3最佳成績87.5,超過人類等級門檻85,顯示邁向類人智慧突破。

對比之下GPT-3的評測結果為0%,GPT-4o為5%,而o3一舉將成績提升至87.5%。

OpenAI計劃明年初發布o3系列模型,CEO Altman暗示可能一段時間內都不會面向大眾上線這類模型,稱希望正式發布前,先有一個聯邦政府的測試框架,指導監控並減少這類模型的風險。從本週五開始OpenAI允許安全研究人員可以註冊訪問o3和o3-mini的預覽。


消息來源

clouse 發表於 2024-12-22 00:26:35

浪費能源:time:...
頁: [1]
查看完整版本: OpenAI最強推理模型o3發布:AGI能力暴漲,接近人類水平