谷歌推出 Gemini 3.5 Flash 及新型视频模型，旨在反击竞争对手

谷歌正在升级 AI 军备竞赛，重点关注速度和创造力。该公司在 I/O 2026 大会上宣布推出 Gemini 3.5 Flash 模型和新型视频生成器 Gemini Omni。此举正值该公司竞相捍卫其领地，对抗 OpenAI 和 Anthropic 之际，同时新的高效竞争对手正在涌现，挑战行业的成本结构。

谷歌在发布公告中谈到新的 3.5 模型系列时表示：“这代表了在构建更强大、更智能的代理方面迈出了重大一步。”该公司声称，Gemini 3.5 Flash 在实现顶级性能的同时，保持了代理工作流和子代理团队服务所需的高速度，直接针对企业市场对可扩展 AI 的需求。

这些发布是谷歌将 Gemini 嵌入其生态系统的全面攻势的一部分。目前，谷歌生态系统的月活跃用户已超过 9 亿，高于去年的 4 亿。除了新模型，谷歌还展示了更新后的 Gemini 应用和“每日简报”（Daily Brief），这是一款面向订阅者的主动式 AI 功能，可扫描用户的收件箱和日历以安排行程。

这场竞争的焦点是在一个由无情创新节奏和巨大资本成本定义的科技行业中的领导地位。虽然谷歌的新模型旨在平衡性能与速度，但小型企业推出的超高效模型让企业客户对其长期经济效益产生怀疑，这可能会将竞争基础从纯粹的能力转移到单次查询成本上。

Gemini 3.5 Flash 与 Omni：速度与多模态的融合

Gemini 3.5 Flash 被定位为谷歌迄今为止速度最快、成本效益最高的模型，旨在成为其许多服务的默认模型。该公司声称，它在关键代码和代理基准测试中的表现优于其前身 Gemini 3.1 Pro，且未牺牲智能。该模型已在 Gemini 应用和谷歌搜索的 AI 模式中立即开放使用，而性能更强大的 Gemini 3.5 Pro 版本预计将于下月发布。

更令人惊讶的发布是 Gemini Omni，这是一种多模态模型，可以从文本、图像、音频和其他视频的任何组合中生成视频。这比谷歌之前的文本转视频模型 Veo 3 更进一步，允许用户通过对话提示编辑和转换现有媒体。Omni 将面向 Gemini 应用和 Google Flow 中的谷歌 AI 订阅者开放，并将免费提供给 YouTube Shorts 创作者。为了应对安全疑虑，谷歌在所有 Omni 生成的视频中都嵌入了 SynthID 数字水印。

新挑战者以低 90% 的成本入局

就在谷歌详细介绍其下一代模型之际，一家成立两年的初创公司 Perceptron Inc. 可能已经重新定义了效率前沿。该公司推出了其旗舰视频分析模型 Mk1，其 API 价格比谷歌、OpenAI 和 Anthropic 的当前一代旗舰模型低 80-90%。

Perceptron 的 Mk1 每百万输入代币的价格仅为 0.15 美元，每百万输出代币的价格为 1.50 美元。根据公司基准测试，它在关键视频和空间推理任务上的表现达到或超过了 Gemini 3.1 Pro 和 GPT-5 等模型。在衡量时间推理的 VSI-Bench 测试中，Mk1 得分为 88.5，在对比模型中最高。这种极低成本下的高性能直接瞄准了机器人、安防和质量控制等应用的工业和企业市场。

Perceptron 这样的竞争对手出现，凸显了谷歌等老牌巨头面临的关键挑战。虽然前沿模型占据了新闻头条，但广泛的企业采纳之战最终可能会由那些能以最低推理成本提供“足够好”智能的供应商赢得。对于投资者而言，竞争格局正从纯粹的性能竞赛转向一个效率和可访问性同样关键的复杂方程，这将影响整个 AI 行业的估值和收入潜力。

本文仅供参考，不构成投资建议。