字节跳动在三月重组后挖角阿里巴巴AI负责人
字节跳动已聘请阿里巴巴通义千问大语言模型团队的前核心负责人余博文,这是一项于3月12日证实的重要人才收购。余博文于3月4日从阿里巴巴离职,仅在其提交辞呈的一天后。他现在将担任字节跳动Seed AI单元内视觉模型和多模态交互团队的后期训练负责人。此举是在阿里巴巴通义实验室于三月进行重组之后发生的,该重组将垂直整合的通义千问团队拆分为独立的横向模块,这一变化促使关键人员离职。
余博文于2022年作为顶尖的“阿里星”人才加入阿里巴巴,在通义千问模型的开发中发挥了关键作用。他迅速成为后期训练负责人,这是一个关键阶段,旨在为特定的产品应用和用户交互完善基础模型。他的离职标志着阿里巴巴AI部门的又一次高层人才流失,此前通义千问代码负责人惠斌元已于一月离职加入Meta。
技术分歧和多模态焦点推动人才转移
阿里巴巴AI实验室的重组是余博文离职的主要催化剂。新的组织结构将预训练和后期训练等团队分离,这与他关于这两个阶段必须深度耦合才能实现最佳模型性能的技术理念直接冲突。再加上阿里巴巴云部门内部对商业化的日益增长的压力,为人才流动创造了一个成熟的环境。
通过聘请余博文,字节跳动正在发出一个信号,即战略性地加强其对多模态AI的关注——这是该技术发展的下一个主要前沿。后期训练对于创建差异化的AI产品至关重要,这些产品能够无缝处理文本、图像和其他数据类型并与之交互。余博文在模型优化和对齐方面的专业知识与字节跳动在真实世界多模态场景中使其模型更直观、更有能力的目标直接契合。
AI人才战不再只关乎薪酬
余博文从阿里巴巴到字节跳动的高调跳槽,体现了AI人才格局的根本性转变。对顶尖工程师的竞争不再仅仅是经济激励。相反,领先专家越来越被那些提供与个人技术愿景相符、提供充足计算资源并促进协作组织结构的企业所吸引。
随着基础大模型能力在主要参与者之间开始趋同,在多模态交互和后期训练等专业领域吸引和留住人才成为决定性的竞争优势。像余博文这样的专家流动正在积极塑造AI竞争的未来格局,预示着下一个技术突破最有可能发生在哪里。