Key Takeaways:
- 谷歌将其第八代 AI 芯片拆分为两条独立产品线:用于模型训练的 TPU 8t 和用于低成本推理的 TPU 8i。
- 此举标志着战略转向支持“智能体 AI”(Agentic AI),即 AI 模型可以执行任务并编排工作流,而不仅仅是简单的内容生成。
- 通过新型 TPU,谷歌旨在减少对英伟达的依赖,并抢占更大的 AI 基础设施市场;摩根士丹利预计,到 2027 年,这可能为其增加 130 亿美元的收入。
Key Takeaways:

谷歌首次将其定制 AI 芯片拆分为两条独立的产品线,这是对行业趋势转变的直接回应:即从单纯的训练模型转向计算更为密集的模型运行(推理)过程。在 Cloud Next 大会上发布的第八代张量处理单元(TPU),包括一款功能强大的训练芯片和一款独立的高效推理芯片。此举旨在挑战英伟达公司在 AI 硬件市场的统治地位。
“创建两款新芯片的决定是‘自然演进’的结果,”谷歌云首席执行官 Thomas Kurian 告诉记者。他补充道,新芯片的设计重点在于能效,“我们感到,随着人们不断扩大训练和推理的规模,能效将成为一个瓶颈。”
新阵容包括:TPU 8t,专为大规模 AI 模型的密集训练过程设计;以及 TPU 8i,针对运行模型以生成答案或执行操作的高容量、低强度推理任务进行了优化。谷歌表示,这两款芯片比去年的第七代 Ironwood TPU 有了重大飞跃,将于今年晚些时候正式商用。TPU 8i 特别大幅增加了高带宽内存(HBM),以解决可能拖慢智能体 AI 应用速度的“内存墙”问题。
这一战略拆分是谷歌的一次豪赌,它认为人工智能的下一个主要浪潮将是“智能体”(Agents)——即能够代表用户进行推理、计划和执行多步骤任务的自主 AI 系统。谷歌基础设施负责人 Amin Vahadat 和 Mark Lohmeyer 在博客文章中表示:“AI 正从回答问题演变为推理并采取行动。”这种转变需要大量的推理算力,而英伟达也一直在通过新芯片和许可协议瞄准这一细分市场。
为了加速这一向智能体的转型,谷歌还推出了 Gemini 企业级智能体平台,这是一个用于构建和管理 AI 智能体的统一系统。此外,谷歌还设立了一项新的 7.5 亿美元基金,帮助包括埃森哲、德勤和甲骨文在内的合作伙伴构建和部署这些解决方案。该平台提供了对 200 多种 AI 模型的访问权限,包括谷歌自家的 Gemini 系列以及来自 Anthropic(谷歌云 TPU 的主要客户)等公司的第三方模型。
开发更强大的自有芯片可能产生重大的财务影响。受 AI 需求推动,谷歌云 2025 年第四季度的收入增长了 48%,达到 177 亿美元。通过开发定制芯片来减少对英伟达的依赖,谷歌有可能降低成本并提高利润率。摩根士丹利在 12 月的一份报告中估计,销售 50 万颗 TPU 芯片可在 2027 年为谷歌的资产负债表增加约 130 亿美元的收入。
新芯片是谷歌一系列公告的一部分,旨在创建一个全面的、适配智能体的技术栈。这包括“智能体数据云”(Agentic Data Cloud)——一种 AI 原生数据架构,以及通过近期收购 Wiz 开发的新型 AI 驱动网络安全解决方案。通过控制从定制硬件到智能体构建平台的整个技术栈,谷歌正强势发力,力争成为下一代 AI 时代的基石基础设施提供商。
本文仅供参考,不构成投资建议。