谷歌全新的 Gemini Spark 智能体旨在超越简单的聊天功能,在其生态系统中自主完成任务,包括代表用户进行购买。
谷歌全新的 Gemini Spark 智能体旨在超越简单的聊天功能,在其生态系统中自主完成任务,包括代表用户进行购买。

谷歌正押注人工智能的未来不在于回答问题,而在于完成任务。在 I/O 2026 大会上,该公司发布了一系列以 Gemini Spark 为核心的新产品。Gemini Spark 是一款持久化的 AI 智能体,旨在即使在用户离线时也能跨谷歌服务工作,这标志着其向自主系统领域迈出了最雄心勃勃的一步。
“我们正处于周期的这个阶段,人们希望在日常使用的产品中看到真正的价值,”谷歌及 Alphabet 首席执行官桑达尔·皮查伊在简报中表示。他认为,Spark 的价值在于它在谷歌云中全天候运行,因此“你不需要一直开着笔记本电脑来确保它在运行。”
该智能体由谷歌全新的 Gemini 3.5 Flash 模型驱动,并在名为 Antigravity 的框架内运行,允许它跨 Gmail、文档和日历等应用程序执行多步骤工作流。该服务将提供给新的 Google AI Ultra 计划订阅者,该计划起售价为每月 100 美元,使用限制是 Pro 计划的五倍,并提供 20TB 的存储空间。
这些声明使谷歌在构建终极 AI 智能体的激烈竞争中,与微软、OpenAI 和 Anthropic 展开角逐。该公司正押注其与消费者服务的深度集成,以及今年计划投入 1800 亿至 1900 亿美元的巨额资本支出,将在市场从对话式 AI 转向自主行动的过程中赋予其决定性优势。
为了让智能体变得真正有用,它们需要与现实世界,特别是商业活动互动。谷歌为此引入了两个新协议:智能体支付协议(AP2)和通用商业协议(UCP)。AP2 是一个旨在让 AI 智能体在用户定义的界限内进行安全购买的系统,谷歌将其安全措施比作给青少年他们的第一张借记卡。
该系统在用户、商家和支付处理器之间创建了一个可验证的链接。它建立在 UCP 之上,这是今年早些时候宣布的一个开源标准,为智能体和商业系统提供了通用语言。UCP 技术委员会目前包括亚马逊、Meta 和微软等竞争对手,这表明行业在需要共享框架来实现智能体驱动型商业方面已达成广泛共识。谷歌还将在今年夏天推出“通用购物车”,在搜索、Gemini、YouTube 和 Gmail 间同步,以跟踪价格和优惠。
除了以智能体为中心的声明外,谷歌还推出了旨在降低 AI 创作门槛的工具。Google Pics 是一款全新的设计和图像生成应用,旨在直接与 Canva 和 Anthropic 的 Claude Design 竞争。在 Nano Banana 2 模型驱动下,Pics 允许用户通过简单的文本提示或直接在图像元素上留下评论来生成和编辑复杂的图形,类似于谷歌文档的操作方式。
在视频方面,谷歌正在将 Gemini Omni 模型集成到 YouTube Shorts 中。该功能允许创作者使用文本、图像和音频提示生成和重混视频。该系统旨在自动处理复杂的编辑,同时在不同场景中保持角色的一致性。YouTube 强调了对创作者的保护,包括水印和针对 AI 生成重混的退出控制。
谷歌 Spark 的策略与其竞争对手截然不同。OpenAI 的智能体主要使用浏览器,而 Anthropic 的 Claude Cowork 在用户的桌面上运行,Spark 则通过与谷歌自有的 Workspace 应用和第三方服务的结构化 API 集成来工作。这种方法承诺比屏幕读取具有更高的可靠性和速度,但也意味着 Spark 的功能最初被限制在谷歌所连接的生态系统中。
这些自主系统的可靠性仍然是整个行业面临的关键挑战。一个误解用户意图的智能体可能会产生严重后果,谷歌在发布时通过要求对任何金融交易进行明确的用户确认来减轻这一风险。Gemini Spark 的真正考验不在于它是否能完成工作,而在于用户是否足够信任它并放手让它去做。
本文仅供参考,不构成投资建议。