阿里巴巴实现自研AI GPU量产
阿里巴巴的芯片设计子公司平头哥已开始量产其自主研发的图形处理单元(GPU)。该公司宣布,该芯片旨在处理从大型模型密集训练到微调和推理的大量工作的全范围AI工作负载。新硬件兼容主流AI框架,增强了阿里巴巴的长期计算供应能力。
这一发展是阿里巴巴构建垂直整合AI堆栈战略的基石。通过将其专有GPU与其通义千问大语言模型和云计算基础设施相结合,该公司旨在提供高性能、高成本效益的AI服务。此举标志着向技术自给自足迈出了关键一步,减少了对外国芯片供应商的依赖,并保护了其快速增长的云业务免受地缘政治供应链风险的影响。
自研芯片威胁英伟达90%市场份额
阿里巴巴追求芯片独立性是行业对英伟达市场主导地位广泛反抗的一部分。尽管美国出口管制加速了中国国内芯片的研发工作,但即使是英伟达最大的美国客户也在开发自己的替代方案。包括谷歌、微软和Meta在内的科技巨头正投入数百亿美元开发定制AI加速器,以挑战这家芯片制造商在AI硬件市场估计90%的份额。
主要驱动因素是成本。随着AI工作负载转向推理——即运行训练模型的过程中——公司发现英伟达的通用GPU并非总是最经济的选择。例如,谷歌专为特定目的构建的张量处理单元(TPU)据报道能够提供比英伟达同类服务器低30%-44%的总拥有成本。市场对这一趋势的敏感度非常高;有报道称Meta正在探索谷歌的TPU,导致英伟达在一次交易日中市值蒸发约2500亿美元。
2030年推理工作负载将驱动75%的AI支出
向定制芯片的战略转变与人工智能不断变化的经济学直接相关。根据美国银行分析师的说法,AI推理预计将从目前数据中心AI支出的约50%扩大到2030年的75%。阿里巴巴及其美国同行的专用芯片明确旨在优化这一高增长细分的性能和成本。
这一趋势对曾经推动英伟达崛起的“一芯通用”模式构成了根本性挑战。尽管英伟达正在通过多样化其产品线来应对,但竞争格局正在迅速碎片化。随着主要云提供商和科技公司现在设计自己的芯片,提供更便宜、更高效的硬件以满足迅速从训练转向大规模部署的市场需求,这场竞赛正在进行中。