谷歌全球上線 AI 影片編輯器 Google Flow 及對話式影片生成模型 Gemini Omni,正面挑戰 Adobe 在創意軟體領域的霸主地位。
谷歌全球上線 AI 影片編輯器 Google Flow 及對話式影片生成模型 Gemini Omni,正面挑戰 Adobe 在創意軟體領域的霸主地位。

谷歌正在升級 AI 創意領域的軍備競賽,在全球範圍內推出其 Google Flow 電影製作工具,並引入了 Gemini Omni,這是一款透過對話提示生成和編輯影片的新模型。這一舉措是在 Google I/O 2026 大會上宣布的,旨在透過讓沒有專業編輯技能的用戶也能進行複雜的影片製作,使這家科技巨頭能夠直接在價值數十億美元的創意軟體市場中與 Adobe 競爭。
「Omni 是邁向通用人工智慧(AGI)的關鍵一步,」谷歌 DeepMind 執行長德米斯·哈薩比斯(Demis Hassabis)在演講中表示,並補充稱未來的版本將能夠輸出用戶想要的「任何內容」。
該新系列的首個模型 Gemini Omni Flash 是一個多模態系統,接受文字、音訊、圖像和影片作為輸入以生成新的影片內容。與傳統的文字轉影片工具不同,Omni 旨在理解物理規律和上下文,以創造更真實的結果。新功能正在向付費谷歌 AI 訂閱者推出,也將上線 YouTube Shorts 和 YouTube Create 應用。
此次發布對 Adobe 的創意系列產品構成了直接威脅,長期以來該系列一直是行業標準。對於谷歌而言,成功進入 AI 驅動的創意市場可能會開闢一個重要的新收入來源,並鞏固其股票作為 AI 創新領導者的地位。這一聲明釋放了谷歌尋求將其在人工智慧領域的深厚投資轉化為收益的看漲信號。
谷歌 Gemini Omni 戰略的核心是用簡單的對話取代傳統編輯軟體的複雜性——後者往往具有陡峭的學習曲線和錯綜複雜的介面。用戶可以使用自然語言命令修改影片,而系統在編輯過程中能保持角色和場景的一致性。
例如,用戶可以拿一段現有的影片,要求 Omni 更改背景、改變視覺風格,甚至改變攝像機角度。在演示中,谷歌展示了該模型如何讓鏡面在被觸摸時像液體一樣波動,或者用氣泡創作雕塑,凸顯了系統理解和操縱物體在物理世界中行為的能力。這種方法旨在讓普通大眾(而不僅僅是專業創作者)感到工具的直觀易用。
意識到強大的 AI 媒體工具對信任和安全帶來的挑戰,谷歌在所有透過 Omni 生成的影片中嵌入了其 SynthID 水印。該技術旨在清晰地識別媒體為 AI 生成,公司表示驗證工具將在 Gemini、Chrome 和搜尋中通用。
公司在推出更高級的功能時也表現得十分謹慎。雖然用戶將能使用 Gemini Omni Flash 創建自己的數位「頭像」,但谷歌表示仍在測試該功能以確保負責任地發布。隨著公司努力解決安全考量,語音修改等更高級的功能仍處於評估階段,這反映了所有主要 AI 公司在構建更強大系統的同時,如何避免侵蝕用戶信任所面臨的艱難平衡。
此次發布是 I/O 大會上宣布的大量 Gemini 新功能的一部分,其他還包括 Docs 和 Gmail 中的新「即時」功能以及「每日簡報」助手。儘管這些繁多且獨立命名的 AI 工具可能會讓消費者感到困惑,但它強調了谷歌激進的多管齊下戰略,即將其 AI 整合到產品生態系統的方方面面,並在多個市場挑戰現有巨頭。
本文僅供參考,不構成投資建議。