本帖最後由 as89725671 於 2026-7-1 15:36 編輯
日前,Google DeepMind 透過官方部落格上,發表新一代 Nano Banana 2 Lite 輕量化圖片生成模型,並與 Gemini Omni Flash 影片生成模型一同展示,協同工作流的創意能力,為開發者與創意工作者,提供低成本、高產能的端對端多媒體生產方案。
身為 Nano Banana 系列的新款升級分支,Google 官方建議初代產品用戶,全面遷移至新模型下使用;Nano Banana 2 Lite 主打「極低延遲」與成本優勢,單張文字生成圖片僅需 4 秒,非常適合互動原型繪製、創意草圖快速迭代等具備高即時性需求的場景。
其定價更低至每千張標準解析度圖片 0.034 美元,大幅降低了批次視覺生產的成本門檻;在提速降價之餘,模型仍維持了精準的提示詞遵循度、穩定的人物形象一致性,以及清晰的圖內文字渲染能力,並未因輕量化定位而犧牲基礎畫質。
目前,該模型已同步於開發者端與消費端上線。開發者可透過 Google AI Studio、Gemini API 與企業 Agent 平台進行串接;一般大眾則能在 Google 搜尋的 AI 模式、Gemini App、Google 相簿等全系列消費性產品中直接體驗。
其次 Google 也在自家 I/O 2026 大會中,發表 Gemini Omni Flash 新版影片生成模型,並表示創作者可先運用 Nano Banana 2 Lite 快速批次生成靜態參考素材,再將圖片輸入至 Omni Flash 轉換為動態影片;同時搭配互動 API,系統能完整保留對話脈絡,支援自然語言驅動的多輪對話式影片編輯。
目前 Google 已在 AI Studio 推出多款示範應用 (Demo),涵蓋人像與風景合成、居家裝潢視覺化、電商商品短影音生成等三大主流商業情境,協助開發者快速實現「圖片+影片」連動的創意應用。
價格方面,Gemini Omni Flash 現處於公開預覽階段,單支影片最長可生成 10 秒,計費方式為每秒 0.1 美元,部分功能限制將於後續版本中逐步迭代優化。
Google 也強調,這兩款模型皆建構於 Google 的安全基礎設施之上,並內建 SynthID 數位浮水印技術,使用者可透過 Gemini、Chrome 等應用程式,輕鬆驗證內容是否為 AI 所生成。
|