- Google 在 I/O 2026 大會上發起了重大的 AI 攻勢,推出了七款全新的 Gemini 語音模型和名為 Gemini Omni 的新型影片生成工具。
- 據報導,新型中階模型 Gemini 3.2 Flash 的推理成本降低了 15 至 20 倍,但在程式碼編寫和推理任務中的表現達到了 GPT-5.5 的 92%。
- 這些發佈是 Google 將代理式 AI 嵌入其生態系統更廣泛策略的一部分,包括全新的 Aluminium OS 和 Android XR 智慧眼鏡。

(P1) Alphabet 旗下的 Google 向競爭對手 OpenAI 和 Anthropic 發起了迄今為止最直接的一擊。在 I/O 2026 開發者大會上,Google 推出了一系列更強大且更具成本效益的 Gemini 模型,旨在奪回 AI 競賽中的領導地位。此次發佈的舉措涵蓋了七個全新的語音模型和一款名為 Gemini Omni 的影片編輯工具,標誌著 Google 策略重點轉向將推理成本降低高達 20 倍,同時使其模型性能逼近 GPT-5.5 等尖端模型。
(P2) Abacus.AI 執行長 Bindu Reddy 在 X 上發帖稱:「傳聞中的基準測試顯示,該模型在編碼和推理任務上達到了 GPT-5.5 性能的 92%,而推理成本卻便宜了 15 至 20 倍。」她指的是尚未正式發佈的 Gemini 3.2 Flash 模型。這種對「性價比」的關注,配合低於 200 毫秒的延遲,是對目前主導市場的高端昂貴模型的直接挑戰。
(P3) 由執行長桑達爾·皮查伊(Sundar Pichai)主持的主旨演講詳細介紹了多戰線的 AI 擴張。據《富比士》報導,活動前的傳聞隨著七款新型 Gemini Live 語音模型的揭曉而得到證實。另外,一款名為 Gemini Omni 的新型影片工具也浮出水面,它能夠重新剪輯影片並進行基於模板的創作,儘管早期用戶反映其計算成本較高。然而,核心焦點仍然是全新的 Gemini 3.2 Flash 模型,MindStudio 的分析表明,其能力將介於 GPT-5.5 和 Anthropic 的 Claude Mythos 之間。
(P4) 對於投資者而言,該策略似乎是對 AI 普及主要障礙——成本——的一次精準打擊。透過激進地降低接近尖端性能模型的價格,Google (GOOGL) 可能會加速 Gemini 在其自身產品以及企業客戶中的部署,從而有可能從微軟支持的 OpenAI 手中奪取更廣闊的市場。此舉給競爭對手帶來了優化自身模型的壓力,可能觸發基於效率而非純粹算力的競爭新階段。
Google 的發佈內容遠不止模型本身,還揭示了一項將 AI 織入其整個產品線的計劃。運行在名為 Aluminium OS 的 Android 與 ChromeOS 融合平台上的一類新「Googlebook」筆記型電腦將配備 Magic Pointer 等 AI 驅動工具,可提供上下文操作建議。包括宏碁 (Acer)、華碩 (ASUS) 和聯想 (Lenovo) 在內的合作夥伴將於今年秋季發佈首批設備。
這種深度集成由 Gemini Intelligence 提供支持,這是一種主動型 AI 層,旨在處理跨使用者應用程式的多步驟任務。該系統已於 5 月 12 日在 Android 秀上進行了預演,將於今年夏天首先在三星 Galaxy 和 Pixel 裝置上推出。其目標是將 AI 從獨立的應用程式轉變為嵌入作業系統的自主代理,能夠完成諸如在 Gmail 中查找教學大綱並將所需書籍添加到購物車而無需使用者手動輸入等任務。
硬體領域的雄心在兩款 Android XR 智慧眼鏡模型的預熱中得到了進一步展示,這兩款產品是與合作夥伴三星和 Warby Parker 共同打造的。其中一個版本專注於透過攝像頭和麥克風進行免持 Gemini 互動,類似於 Meta 的 Ray-Ban 眼鏡。第二個更先進的模型包含鏡片內顯示屏,用於顯示翻譯直播等私密資訊,這一功能對無障礙環境和語言學習具有重要意義。
本文僅供參考,不構成投資建議。