主要亮点
智谱AI发布了其GLM-5大语言模型的技术规范,这标志着中国人工智能发展的一个战略性转变。该模型优先考虑工程效率和与国产硬件的深度整合,而非一味追求基准分数,旨在创建一套自主可控的技术栈。
- 工程级智能: 7440亿参数模型专为复杂、长时间任务设计,超越了简单的代码生成,可实现自主系统工程和规划。
- 创新提升效率: 新的DeepSeek稀疏注意力(DSA)机制在不牺牲性能的前提下,将长上下文的注意力计算量减少1.5至2倍,使大规模AI在经济上更具可行性。
- 国产硬件集成: GLM-5原生优化支持包括华为昇腾在内的中国系列GPU。这种协同优化使单个国产节点达到与两个国际主流GPU相当的性能,并将长序列任务的部署成本降低50%。
