深度求索正投入 3 亿美元进行一场豪赌,认为 AI 的未来可以在没有英伟达的情况下建立,此举可能会重塑全球半导体格局。
返回
深度求索正投入 3 亿美元进行一场豪赌,认为 AI 的未来可以在没有英伟达的情况下建立,此举可能会重塑全球半导体格局。

中国 AI 开发商深度求索(DeepSeek)正在寻求首轮外部融资,拟以 100 亿美元的估值筹集至少 3 亿美元。这是一次战略转型,旨在为其模型从英伟达(Nvidia Corp.)硬件向基于华为技术有限公司(Huawei Technologies Co.)昇腾(Ascend)芯片构建的新系统进行大规模迁移提供资金。
“这对美国来说是一个糟糕的结果,”英伟达首席执行官黄仁勋在最近的一次采访中表示,他在评论先进 AI 模型针对中国硬件进行最优化的前景时如此说道。他的担忧凸显了深度求索此举的利害关系,这代表了领先 AI 企业首次重大尝试,旨在构建一个完全独立于英伟达 CUDA 生态系统的前沿模型。
这笔资金将专门用于 DeepSeek V4 的发布和规模化,这是一个研发时长超过 18 个月的万亿参数模型。据公司消息人士称,该模型采用混合专家(MoE)架构,并具有 100 万 token 的上下文窗口,较其前代的 12.8 万上下文有显著提升。内部基准测试显示,其代码生成能力在 SWE-bench 上超过 80%,在 HumanEval 上超过 90%,并具备处理复杂的代码库级漏洞修复的能力。
这笔资本注入对于证明顶级 AI 模型可以在英伟达赖以维持市场主导地位的 CUDA 软件护城河之外生存至关重要。通过 3 亿美元的投资,深度求索正致力于验证一种高性能的替代方案,这一进展可能会加速中国 AI 的自主可控,并鼓励更广泛的行业摆脱对单一硬件供应商的依赖。
DeepSeek V4 的开发是一项重大的技术工程,而与英伟达脱钩的战略决策使其变得更加复杂。该模型原定于 2 月发布,但由于工程师致力于将核心组件从英伟达的 CUDA 迁移到华为的 CANN(神经网络计算架构),导致了进度延迟。这涉及大量的代码重写,以确保在新硬件堆栈上的性能和稳定性。
V4 预计将发布两个版本:一个针对华为昇腾芯片优化的、用于高级推理和代码生成的全量万亿参数版本;另一个是 2000 亿参数的小型版本,用于通用场景,可在其他国产芯片组上运行。这种双版本策略表明深度求索在对冲硬件依赖的同时,仍在优先发展本土化的 AI 基础设施。该公司最近开始在内蒙古招聘服务器运维和交付人员,这标志着其正从实验室开发转向大规模部署。
尽管深度求索以资本效率著称,但其寻求外部融资的决定反映了在 AI 研究前沿竞争所面临的巨大财务压力。根据 2026 年斯坦福 AI 指数报告,中美顶尖模型之间的性能差距已缩小至仅 2.7 个百分点,而每一点增量收益都需要呈指数级增长的成本。作为参考,OpenAI 最近刚以 3000 亿美元的估值完成了 400 亿美元的融资。
深度求索 3 亿美元的融资不仅是为了运营资金,更是一场关于硬件独立性的战略赌注。通过向国内芯片制造商提供早期访问权限,并刻意不针对英伟达和 AMD 进行优化,该公司正在强行发起一场性能对决。如果 DeepSeek V4 能在华为昇腾芯片上展现出极具竞争力的性能,它将成为一个强有力的概念证明,即最先进的 AI 开发不再排他性地与英伟达生态系统绑定,从而可能改变全球半导体市场的竞争格局。
本文仅供参考,不构成投资建议。