找回密碼註冊
作者: as89725671
查看: 1109
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

Micron Crucial T710 SSD 玩家開箱體驗分享

進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

COUGAR ULTIMUS PRO玩家開箱體驗分享活動

ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

COUGAR AIRFACE 180 玩家開箱體驗分享活動

AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

COUGAR GR 750/GR 850 玩家開箱體驗分享活

ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

打印 上一主題 下一主題

[業界新聞] Google 發布 Gemini Embedding 2 模型,支援多模態交錯輸入

[複製鏈接]| 回復
跳轉到指定樓層
1#
近日,Google 正式推出Gemini Embedding 2 模型,並開啟公開預覽;作為首款基於 Gemini 架構打造的原生多模態嵌入模型,可提供文字、圖像、視訊、音訊與文件的統一嵌入處理。


透過簡化複雜的跨媒體處理流程,該模型能顯著增強 RAG(檢索增強生成)與語意搜尋應用的處理能力。

在多模態處理上,Gemini Embedding 2 也提供具體的規格支援:
  • 文本輸入:上下文長度可達 8,192 個 Token。
  • 影像處理:單次請求可處理 6 張 PNG/JPEG 圖片。
  • 視訊支援:支援長達 120 秒的 MP4/MOV 視訊輸入。
  • 原生音訊:無需事先轉錄,即可直接處理音訊資料。
  • 文件嵌入:支援直接嵌入 6 頁以內的 PDF 文件。

此外,也支援多模態交錯輸入(如圖文混合),進而精準捕捉不同媒體間的複雜關聯,完美貼合現實世界中複雜的資料場景。

並且採用俄羅斯套娃的表徵學習技術(Matryoshka Representation Learning, MRL);其輸出維度可從預設的 3,072 維度進行動態縮放;Google 也推薦使用 3,072、1,536 或 768 維度,讓開發者能在保障處理品質的前提下,可依據儲存需求靈活調整。


而性能表現,Gemini Embedding 2 樹立了多模態嵌入的新標桿,尤其在語音處理方面;而文字、圖像、視訊等跨媒介檢索任務,也優於同類主流模型。


目前 Google 表示到,已有 Everlaw 與 Sparkonomy 等企業已作為早期合作夥伴,在法律檢索及創作者經濟等領域實現顯著的效率提升;並宣布即日起,開發者也可透過 Gemini APIVertex AI 存取此模型。


Google 更同步提供式碼範例與互動式筆記,協助開發者快速建構新一代多模態 AI 應用。


消息來源 : 1 , 2
更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2026-3-12 16:13 , Processed in 2.488549 second(s), 68 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表