谷歌全球上线 AI 视频编辑器 Google Flow 及对话式视频生成模型 Gemini Omni,正面挑战 Adobe 在创意软件领域的霸主地位。
谷歌全球上线 AI 视频编辑器 Google Flow 及对话式视频生成模型 Gemini Omni,正面挑战 Adobe 在创意软件领域的霸主地位。

谷歌正在升级 AI 创意领域的军备竞赛,在全球范围内推出其 Google Flow 电影制作工具,并引入了 Gemini Omni,这是一款通过对话提示生成和编辑视频的新模型。这一举措是在 Google I/O 2026 大会上宣布的,旨在通过让没有专业编辑技能的用户也能进行复杂的视频制作,使这家科技巨头能够直接在价值数十亿美元的创意软件市场中与 Adobe 竞争。
“Omni 是迈向通用人工智能(AGI)的关键一步,”谷歌 DeepMind 首席执行官德米斯·哈萨比斯(Demis Hassabis)在演讲中表示,并补充称未来的版本将能够输出用户想要的“任何内容”。
该新系列的首个模型 Gemini Omni Flash 是一个多模态系统,接受文本、音频、图像和视频作为输入以生成新的视频内容。与传统的文本转视频工具不同,Omni 旨在理解物理规律和上下文,以创造更真实的结果。新功能正在向付费谷歌 AI 订阅者推出,也将上线 YouTube Shorts 和 YouTube Create 应用。
此次发布对 Adobe 的创意系列产品构成了直接威胁,长期以来该系列一直是行业标准。对于谷歌而言,成功进入 AI 驱动的创意市场可能会开辟一个重要的新收入来源,并巩固其股票作为 AI 创新领导者的地位。这一声明释放了谷歌寻求将其在人工智能领域的深厚投资转化为收益的看涨信号。
谷歌 Gemini Omni 战略的核心是用简单的对话取代传统编辑软件的复杂性——后者往往具有陡峭的学习曲线和错综复杂的界面。用户可以使用自然语言命令修改视频,而系统在编辑过程中能保持角色和场景的一致性。
例如,用户可以拿一段现有的视频,要求 Omni 更改背景、改变视觉风格,甚至改变摄像机角度。在演示中,谷歌展示了该模型如何让镜面在被触摸时像液体一样波动,或者用气泡创作雕塑,凸显了系统理解和操纵物体在物理世界中行为的能力。这种方法旨在让普通大众(而不仅仅是专业创作者)感到工具的直观易用。
意识到强大的 AI 媒体工具对信任和安全带来的挑战,谷歌在所有通过 Omni 生成的视频中嵌入了其 SynthID 水印。该技术旨在清晰地识别媒体为 AI 生成,公司表示验证工具将在 Gemini、Chrome 和搜索中通用。
公司在推出更高级的功能时也表现得十分谨慎。虽然用户将能使用 Gemini Omni Flash 创建自己的数字“头像”,但谷歌表示仍在测试该功能以确保负责任地发布。随着公司努力解决安全考量,语音修改等更高级的功能仍处于评估阶段,这反映了所有主要 AI 公司在构建更强大系统的同时,如何避免侵蚀用户信任所面临的艰难平衡。
此次发布是 I/O 大会上宣布的大量 Gemini 新功能的一部分,其他还包括 Docs 和 Gmail 中的新“实时”功能以及“每日简报”助手。尽管这些繁多且独立命名的 AI 工具可能会让消费者感到困惑,但它强调了谷歌激进的多管齐下战略,即将其 AI 整合到产品生态系统的方方面面,并在多个市场挑战现有巨头。
本文仅供参考,不构成投资建议。