深度求索寻求 3 亿美元融资，拟将其 AI 模型从英伟达迁移至华为

中国 AI 开发商深度求索（DeepSeek）正在寻求首轮外部融资，拟以 100 亿美元的估值筹集至少 3 亿美元。这是一次战略转型，旨在为其模型从英伟达（Nvidia Corp.）硬件向基于华为技术有限公司（Huawei Technologies Co.）昇腾（Ascend）芯片构建的新系统进行大规模迁移提供资金。

“这对美国来说是一个糟糕的结果，”英伟达首席执行官黄仁勋在最近的一次采访中表示，他在评论先进 AI 模型针对中国硬件进行最优化的前景时如此说道。他的担忧凸显了深度求索此举的利害关系，这代表了领先 AI 企业首次重大尝试，旨在构建一个完全独立于英伟达 CUDA 生态系统的前沿模型。

这笔资金将专门用于 DeepSeek V4 的发布和规模化，这是一个研发时长超过 18 个月的万亿参数模型。据公司消息人士称，该模型采用混合专家（MoE）架构，并具有 100 万 token 的上下文窗口，较其前代的 12.8 万上下文有显著提升。内部基准测试显示，其代码生成能力在 SWE-bench 上超过 80%，在 HumanEval 上超过 90%，并具备处理复杂的代码库级漏洞修复的能力。

这笔资本注入对于证明顶级 AI 模型可以在英伟达赖以维持市场主导地位的 CUDA 软件护城河之外生存至关重要。通过 3 亿美元的投资，深度求索正致力于验证一种高性能的替代方案，这一进展可能会加速中国 AI 的自主可控，并鼓励更广泛的行业摆脱对单一硬件供应商的依赖。

押注国产芯片的万亿参数豪赌

DeepSeek V4 的开发是一项重大的技术工程，而与英伟达脱钩的战略决策使其变得更加复杂。该模型原定于 2 月发布，但由于工程师致力于将核心组件从英伟达的 CUDA 迁移到华为的 CANN（神经网络计算架构），导致了进度延迟。这涉及大量的代码重写，以确保在新硬件堆栈上的性能和稳定性。

V4 预计将发布两个版本：一个针对华为昇腾芯片优化的、用于高级推理和代码生成的全量万亿参数版本；另一个是 2000 亿参数的小型版本，用于通用场景，可在其他国产芯片组上运行。这种双版本策略表明深度求索在对冲硬件依赖的同时，仍在优先发展本土化的 AI 基础设施。该公司最近开始在内蒙古招聘服务器运维和交付人员，这标志着其正从实验室开发转向大规模部署。

斥资 3 亿美元逃离生态围城

尽管深度求索以资本效率著称，但其寻求外部融资的决定反映了在 AI 研究前沿竞争所面临的巨大财务压力。根据 2026 年斯坦福 AI 指数报告，中美顶尖模型之间的性能差距已缩小至仅 2.7 个百分点，而每一点增量收益都需要呈指数级增长的成本。作为参考，OpenAI 最近刚以 3000 亿美元的估值完成了 400 亿美元的融资。

深度求索 3 亿美元的融资不仅是为了运营资金，更是一场关于硬件独立性的战略赌注。通过向国内芯片制造商提供早期访问权限，并刻意不针对英伟达和 AMD 进行优化，该公司正在强行发起一场性能对决。如果 DeepSeek V4 能在华为昇腾芯片上展现出极具竞争力的性能，它将成为一个强有力的概念证明，即最先进的 AI 开发不再排他性地与英伟达生态系统绑定，从而可能改变全球半导体市场的竞争格局。

本文仅供参考，不构成投资建议。