Google今天發布了Gemini 2.5 Pro的升級預覽版,並將在未來幾週內全面上市。此版本模型更新是採用上個月發布的2.5 Pro I/O 版本(05-0 6),帶來了程式設計能力升級。如今06-05在AIDER Polyglot 等基準測試中繼續保持了這種領先優勢,同時在GPQA和Humanity's Last Exam (HLE)」——這些極具挑戰性的測試中,評估模型的數學、科學、知識和推理能力——也取得了頂級表現。
同時Google指出今天06-05在LMArena上的Elo分數躍升24分,達到1470分,而在WebDevArena上的Elo分數躍升35分,達到1443分。
在最近幾次模型升級中,有些人注意到程式設計之外的效能有所下降,尤其是與03-25相比。 Google現在正在透過改進樣式和結構來解決這項回饋,以便Gemini 2.5 Pro能夠透過格式更好的回應更具創造力。
Gemini 2.5 Pro模型更新目前仍處於預覽階段,但您可以期待幾週後正式發布並發布穩定版本。它現在已透過Google AI Studio 和Vertex AI 推送至Gemini API,開發者能夠根據預算控製成本和延遲(如2.5 Flash中導入的那樣)。 Gemini應用程式今天也將獲得2.5 Pro預覽版升級。
消息來源
|