谷歌全新的 Gemini Spark 智能體旨在超越簡單的聊天功能,在其生態系統中自主完成任務,包括代表用戶進行購買。
谷歌全新的 Gemini Spark 智能體旨在超越簡單的聊天功能,在其生態系統中自主完成任務,包括代表用戶進行購買。

谷歌正押注人工智能的未來不在於回答問題,而在於完成任務。在 I/O 2026 大會上,該公司發布了一系列以 Gemini Spark 為核心的新產品。Gemini Spark 是一款持久化的 AI 智能體,旨在即使在用戶離線時也能跨谷歌服務工作,這標誌著其向自主系統領域邁出了最雄心勃勃的一步。
「我們正處於週期的這個階段,人們希望在日常使用的產品中看到真正的價值,」谷歌及 Alphabet 執行長桑達爾·皮查伊在簡報中表示。他認為,Spark 的價值在於它在谷歌雲中全天候運行,因此「你不需要一直開著筆記型電腦來確保它在運行。」
該智能體由谷歌全新的 Gemini 3.5 Flash 模型驅動,並在名為 Antigravity 的框架內運行,允許它跨 Gmail、文件和日曆等應用程式執行多步驟工作流。該服務將提供給新的 Google AI Ultra 計劃訂閱者,該計劃起售價為每月 100 美元,使用限制是 Pro 計劃的五倍,並提供 20TB 的存儲空間。
這些聲明使谷歌在構建終極 AI 智能體的激烈競爭中,與微軟、OpenAI 和 Anthropic 展開角逐。該公司正押注其與消費者服務的深度集成,以及今年計劃投入 1800 億至 1900 億美元的巨額資本支出,將在市場從對話式 AI 轉向自主行動的過程中賦予其決定性優勢。
為了讓智能體變得真正有用,它們需要與現實世界,特別是商業活動互動。谷歌為此引入了兩個新協議:智能體支付協議(AP2)和通用商業協議(UCP)。AP2 是一個旨在讓 AI 智能體在用戶定義的界限內進行安全購買的系統,谷歌將其安全措施比作給青少年他們的第一張借記卡。
該系統在用戶、商家和支付處理器之間創建了一個可驗證的鏈接。它建立在 UCP 之上,這是今年早些時候宣布的一個開源標準,為智能體和商業系統提供了通用語言。UCP 技術委員會目前包括亞馬遜、Meta 和微軟等競爭對手,這表明行業在需要共享框架來實現智能體驅動型商業方面已達成廣泛共識。谷歌還將在今年夏天推出「通用購物車」,在搜索、Gemini、YouTube 和 Gmail 間同步,以跟蹤價格和優惠。
除了以智能體為中心的聲明外,谷歌還推出了旨在降低 AI 創作門檻的工具。Google Pics 是一款全新的設計和圖像生成應用,旨在直接與 Canva 和 Anthropic 的 Claude Design 競爭。在 Nano Banana 2 模型驅動下,Pics 允許用戶通過簡單的文本提示或直接在圖像元素上留下評論來生成和編輯複雜的圖形,類似於谷歌文件的操作方式。
在視頻方面,谷歌正在將 Gemini Omni 模型集成到 YouTube Shorts 中。該功能允許創作者使用文本、圖像和音頻提示生成和重混視頻。該系統旨在自動處理複雜的編輯,同時在不同場景中保持角色的一致性。YouTube 強調了對創作者的保護,包括水印和針對 AI 生成重混的退出控制。
谷歌 Spark 的策略與其競爭對手截然不同。OpenAI 的智能體主要使用瀏覽器,而 Anthropic 的 Claude Cowork 在用戶的桌面上運行,Spark 則通過與谷歌自有的 Workspace 應用和第三方服務的結構化 API 集成來工作。這種方法承諾比屏幕讀取具有更高的可靠性和速度,但也意味著 Spark 的功能最初被限制在谷歌所連接的生態系統中。
這些自主系統的可靠性仍然是整個行業面臨的關鍵挑戰。一個誤解用戶意圖的智能體可能會產生嚴重後果,谷歌在發布時通過要求對任何金融交易進行明確的用戶確認來減輕這一風險。Gemini Spark 的真正考驗不在於它是否能完成工作,而在於用戶是否足夠信任它並放手讓它去做。
本文僅供參考,不構成投資建議。