谷歌新款 Gemini 3.5 Flash 模型旨在重新定義 AI 效率前沿,但一家初創公司在成本上可能已經超越了它。
谷歌新款 Gemini 3.5 Flash 模型旨在重新定義 AI 效率前沿,但一家初創公司在成本上可能已經超越了它。

谷歌正在升級 AI 軍備競賽,重點關注速度和創造力。該公司在 I/O 2026 大會上宣布推出 Gemini 3.5 Flash 模型和新型影片生成器 Gemini Omni。此舉正值該公司競相捍衛其領地,對抗 OpenAI 和 Anthropic 之際,同時新的高效競爭對手正在湧現,挑戰行業的成本結構。
谷歌在發布公告中談到新的 3.5 模型系列時表示:「這代表了在構建更強大、更智能的代理方面邁出了重大一步。」該公司聲稱,Gemini 3.5 Flash 在實現頂級性能的同時,保持了代理工作流和子代理團隊服務所需的高速度,直接針對企業市場對可擴展 AI 的需求。
這些發布是谷歌將 Gemini 嵌入其生態系統的全面攻勢的一部分。目前,谷歌生態系統的月活躍用戶已超過 9 億,高於去年的 4 億。除了新模型,谷歌還展示了更新後的 Gemini 應用和「每日簡報」(Daily Brief),這是一款面向訂閱者的主動式 AI 功能,可掃描用戶的收件箱和日曆以安排行程。
這場競爭的焦點是在一個由無情創新節奏和巨大資本成本定義的科技行業中的領導地位。雖然谷歌的新模型旨在平衡性能與速度,但小型企業推出的超高效模型讓企業客戶對其長期經濟效益產生懷疑,這可能會將競爭基礎從純粹的能力轉移到單次查詢成本上。
Gemini 3.5 Flash 被定位為谷歌迄今為止速度最快、成本效益最高的模型,旨在成為其許多服務的默認模型。該公司聲稱,它在關鍵代碼和代理基準測試中的表現優於其前身 Gemini 3.1 Pro,且未犧牲智能。該模型已在 Gemini 應用和谷歌搜索的 AI 模式中立即開放使用,而性能更強大的 Gemini 3.5 Pro 版本預計將於下月發布。
更令人驚訝的發布是 Gemini Omni,這是一種多模態模型,可以從文本、圖像、音頻和其他影片的任何組合中生成影片。這比谷歌之前的文本轉影片模型 Veo 3 更進一步,允許用戶通過對話提示編輯和轉換現有媒體。Omni 將面向 Gemini 應用和 Google Flow 中的谷歌 AI 訂閱者開放,並將免費提供給 YouTube Shorts 創作者。為了應對安全疑慮,谷歌在所有 Omni 生成的影片中都嵌入了 SynthID 數字水印。
就在谷歌詳細介紹其下一代模型之際,一家成立兩年的初創公司 Perceptron Inc. 可能已經重新定義了效率前沿。該公司推出了其旗艦影片分析模型 Mk1,其 API 價格比谷歌、OpenAI 和 Anthropic 的當前一代旗艦模型低 80-90%。
Perceptron 的 Mk1 每百萬輸入代幣的價格僅為 0.15 美元,每百萬輸出代幣的價格為 1.50 美元。根據公司基準測試,它在關鍵影片和空間推理任務上的表現達到或超過了 Gemini 3.1 Pro 和 GPT-5 等模型。在衡量時間推理的 VSI-Bench 測試中,Mk1 得分為 88.5,在對比模型中最高。這種極低成本下的高性能直接瞄準了機器人、安防和質量控制等應用的工業和企業市場。
Perceptron 這樣的競爭對手出現,凸顯了谷歌等老牌巨頭面臨的關鍵挑戰。雖然前沿模型佔據了新聞頭條,但廣泛的企業採納之戰最終可能會由那些能以最低推理成本提供「足夠好」智能的供應商贏得。對於投資者而言,競爭格局正從純粹的性能競賽轉向一個效率和可訪問性同樣關鍵的複雜方程,這將影響整個 AI 行業的估值和收入潛力。
本文僅供參考,不構成投資建議。