核心摘要:
- DeepSeek计划在4月底前发布其万亿参数的V4模型。
- 具备百万级Token上下文窗口,并与国产芯片深度整合。
- 阿里巴巴、腾讯和字节跳动的预订单推动AI芯片价格上涨20%。
核心摘要:

中国人工智能公司 DeepSeek 计划在 4 月底前发布其万亿参数的 V4 大语言模型。此举已在硬件供应链中引发连锁反应,随着阿里巴巴和腾讯等科技巨头预订数十万颗 AI 芯片,价格已上涨 20%。
据新浪科技报道,该公司创始人梁文锋在近期的内部沟通中披露:“公司的新旗舰大模型 DeepSeek V4 将于 4 月底正式发布。”
新模型拥有万亿级参数规模和百万级上下文窗口,其规格旨在竞争 AI 开发的最前沿。预见到这一趋势,包括阿里巴巴、字节跳动和腾讯在内的中国主要科技公司已经为下一代 AI 计算芯片投放了巨额预订单。这种需求的激增导致新硬件的价格跳涨了约 20%。
这一进展标志着中国减少对外国技术依赖(特别是主导 AI 行业的英伟达 CUDA 软件栈)战略迈出的关键一步。通过实现与华为昇腾(Ascend)等国产硬件的深度适配,DeepSeek V4 的发布预示着中国半导体行业有望获得提振,并加剧了国内云服务提供商之间的竞争。
争相确保高性能计算资源是对日益升级的 AI 军备竞赛的直接回应。阿里巴巴(09988.HK)、腾讯(00700.HK)和字节跳动不仅在为 V4 发布做准备,还计划将新的 DeepSeek 模型整合到各自的云服务和 AI 产品中。该战略旨在保持其在面对国内外对手时的竞争力。
拥抱华为昇腾等国产芯片的举措尤为重要。它代表了“去 CUDA”行动的实质性转变,这是一项旨在建立独立于美国技术的自给自足 AI 生态系统的国家努力。尽管英伟达的 GPU 仍是全球标准,但中国头部科技公司的这种大规模部署为国产芯片制造商提供了关键的试验场和显著的收入流。20% 的价格上涨反映了能够训练和运行万亿参数模型的硬件所面临的即时、高风险需求。对于阿里巴巴和腾讯等云供应商而言,提供基于新模型的服务对于保留和吸引企业客户至关重要,这直接影响到他们在利润丰厚的 AI 即服务(AI-as-a-service)市场中的未来增长。
本文仅供参考,不构成投资建议。