腾讯正在将其 AI 战略从单纯追求参数规模转向通过其新开源模型优化成本效益和现实任务的执行效率。
返回
腾讯正在将其 AI 战略从单纯追求参数规模转向通过其新开源模型优化成本效益和现实任务的执行效率。

腾讯控股有限公司于 4 月 23 日发布了 Hy3 预览版模型。这是一个拥有 2950 亿参数的开源人工智能系统,标志着腾讯的战略重心已从追求纯粹的规模转向注重效率和实际应用。随着国内 AI 竞争加剧,此次发布代表了这家中国科技巨头的重大调整,重点是为复杂的现实任务创建一个具有成本效益的模型。
“Hy3 预览版是混元大模型重构的第一步,”腾讯首席 AI 科学家、大语言模型团队负责人姚顺源在声明中表示。“我们希望通过此次开源发布,获得开源社区和用户的真实反馈,以帮助提高 Hy3 正式版的实用性。”
新模型采用混合专家(MoE)架构,总参数量达 2950 亿,但针对任何特定任务仅激活 210 亿参数,并配备 256K 上下文窗口。这一设计旨在平衡高端能力与较低的运营成本。内部测试显示,在 AI 智能体 CodeBuddy 和 WorkBuddy 等内部产品上,该模型的首字延迟降低了 54%,端到端耗时减少了 47%,成功率超过 99.99%。
此举表明腾讯押注于:即使没有业内最大规模的模型,凭借卓越的工程能力和与其庞大产品生态系统的深度集成,也能获得竞争优势。与此同时,据报道,腾讯和竞争对手阿里巴巴集团正在洽谈投资 AI 初创公司 DeepSeek,该公司寻求超过 200 亿美元的估值。这表明腾讯正采取双重战略,在自主研发的同时,也在买入有前途的第三方技术。
Hy3 的发布标志着腾讯 AI 理念的明显转变。该公司现在认为 3000 亿参数区间是一个最佳平衡点,在此区间内,复杂推理和长上下文理解等核心能力可被充分解锁,而进一步增加规模带来的回报将递减。这反驳了行业早期将不断增加的参数量作为衡量模型实力的主要标准的观点。
此次调整是在腾讯 AI 团队重组及 2 月份建立新基础设施之后进行的。目前的重点是能够执行复杂工作流的“AI 智能体”,腾讯云与智慧产业事业部 CEO 汤道生称之为下一个范式。通过开源 Hy3 预览版,腾讯旨在通过收集现实使用数据来加速其进化,为正式版的发布精炼模型。
腾讯的务实做法是在竞争激烈和资源受限的背景下提出的。训练和扩展模型的高昂成本,加上美国对英伟达等公司先进半导体的出口限制,正迫使中国企业评估华为等供应商的国内替代方案。
在这种环境下,效率至关重要。据报道腾讯正在接洽的初创公司 DeepSeek,因以西方同行几分之一的预算开发出强大的模型而声名鹊起。腾讯在推出自身注重效率的 Hy3 模型的同时,寻求入股 DeepSeek,突显了其两手抓的战略:为自身生态系统开发强大的集成化自有模型,同时通过投资接触其他创新者,以对冲技术死胡同的风险。这种双重方法的成功,对于在挑战重重的中国 AI 市场中生存至关重要。
本文仅供参考,不构成投资建议。