关键要点:
- OpenAI与博通推出Jalapeño,一款耗时九个月开发的定制LLM推理芯片
- 博通CEO表示,该芯片相比现有方案可将推理成本降低约50%
- 基于Jalapeño的系统预计将于2026年底前以吉瓦级规模首次部署
关键要点:

OpenAI首款定制芯片,由博通联合开发,耗时九个月,有望将推理成本减半并降低对英伟达GPU的依赖。
OpenAI与博通推出Jalapeño——一款定制推理芯片,博通首席执行官称其可将成本降低约50%,对英伟达在AI芯片领域的主导地位构成挑战。
"通过自行设计更多底层架构,我们能够以更高效率提供更多智能服务,"OpenAI总裁兼联合创始人格雷格·布罗克曼在一份声明中表示。"Jalapeño是我们长期全栈基础设施战略的一部分,旨在让算力变得更加充足。"
这款芯片从初始设计到流片仅耗时九个月,是一款专为大语言模型推理设计的全新架构,而非对早期AI加速器的改良。工程样品已在生产目标频率和功耗下运行GPT-5.3-Codex-Spark,早期测试显示其每瓦性能"显著优于"当前最先进的芯片。博通股价在消息公布后上涨约2%,但随后因半导体板块整体下跌而回落约3%。
这一合作标志着OpenAI的战略转向。自2022年生成式AI热潮兴起以来,该公司一直是英伟达最大的GPU买家之一。通过自行设计芯片,OpenAI希望在推理算力需求激增的背景下降低采购成本。基于Jalapeño的系统预计于2026年底前首次部署,并计划与微软及其他合作伙伴一道,扩展至吉瓦级数据中心。
Jalapeño是一款专用集成电路,专为LLM推理设计。与英伟达的通用图形处理器(可处理多种工作负载的训练和推理)不同,ASIC以灵活性换取目标任务的效率。OpenAI表示,该架构减少了数据移动,并平衡了算力、内存和网络资源,使利用率"更接近理论峰值性能"。博通提供了其Tomahawk网络芯片及芯片实现技术,伟创力则负责板卡、机架和系统集成。
这款芯片是规划中多代计算平台的第一代产品。OpenAI还与亚马逊云服务就Trainium芯片达成协议,并与超威半导体和Cerebras展开合作,这是一项有意为之的多元化战略,以摆脱对英伟达的依赖。该公司表示,九个月的开发周期可能是高性能半导体领域有史以来最快的ASIC开发速度,部分得益于OpenAI自身模型帮助设计和优化芯片。
对于投资者而言,这一影响利弊兼具。博通自2022年底以来股价已上涨近七倍,如今获得OpenAI这一高量级定制芯片客户,使其AI收入来源不再局限于网络设备。英伟达凭借其GPU主导了AI芯片市场,如今却面临最大客户之一为其推理业务——AI算力增长最快的细分领域——打造替代方案。OpenAI未披露该项目的总成本或单颗芯片价格,但博通首席执行官霍克·谭将此次合作形容为"多代路线图的起点",并计划从2026年起实现吉瓦级数据中心部署。
本文仅供信息参考,不构成投资建议。