阿里巴巴推出万相 2.7-Video AI，挑战 OpenAI Sora 的领先地位

(P1) 阿里巴巴集团（9988.HK）推出了升级版的万相 2.7-Video 生成模型，通过直接挑战 OpenAI 备受期待的 Sora，加剧了人工智能领域的竞争。该新模型支持包括文本、图像和音频在内的多模态输入，专注于从生成到最终编辑的整个创作工作流。这一功能组合旨在快速增长的生成式视频市场中提供实用优势。

(P2) 阿里巴巴在公告中表示：“该模型专注于整个创作工作流，涵盖生成、编辑、复制、重塑、驱动、延续和参考等过程。” 这种对综合性、一体化工具的强调，表明其战略重点在于易用性和创作者控制力，而不仅仅是原始的生成能力。

(P3) 万相 2.7-Video 允许用户通过简单的命令对视频场景进行局部调整，编辑区域可与原始素材无缝整合。它支持根据文本指令或参考图像添加或删除元素、替换对象以及修改属性。例如，背景可以从夏季改为秋季，或者将整个视频风格转换为羊毛毡效果，同时保持角色动作不变。这种颗粒度极高的控制力和风格转换能力是其核心差异化优势。

(P4) 此次发布向包括 OpenAI 和谷歌在内的竞争对手施加了压力，要求他们不仅要展示令人印象深刻的生成能力，还要展示一条通往用户友好、商业化可行产品的清晰路径。对于阿里巴巴而言，成功的视频模型可以显著提升其云业务的吸引力，提供吸引并留住企业客户的强大新工具。该公司股票目前的空头头寸比例高达 62.85%，如果该模型证明其商业价值，可能会重新赢得投资者的青睐。

AI 视频竞赛中的新竞争者

阿里巴巴凭借万相 2.7-Video 进入高端生成式视频领域，这对这家中国科技巨头而言具有重大意义。虽然 OpenAI 的 Sora 以其超真实的视频生成能力吸引了公众的想象力，但它尚未向公众发布。阿里巴巴专注于从初始生成到详细编辑的完整工作流，这可能使其在该技术的实际应用中获得先发优势。该模型能够执行视频的“补全”和“扩充”，以及保持风格和角色的一致性，这些都是专业创作者一直追求的功能。

该模型的多模态能力接受文本、图像、视频和音频作为输入，使其成为适用于广泛创意应用的多功能工具。例如，用户可以在同一个工作流中提供一段短视频剪辑、一张风格参考图和一段文本提示来修改场景内容。这种集成方法与创作者目前使用的零散工具链形成了鲜明对比，后者通常需要多个软件配合才能完成不同的任务。

对竞争格局的影响

生成式 AI 市场正变得日益拥挤，各大科技巨头和资金雄厚的初创公司都在争夺主导地位。阿里巴巴的万相 2.7-Video 不仅将与 OpenAI 的 Sora 竞争，还将面临谷歌、Meta 以及 Runway 和 Pika 等初创公司的挑战。关键的战场可能不仅在于生成的视频质量，还在于易用性、成本效益以及与现有创意工作流的集成程度。

对于阿里巴巴而言，万相 2.7-Video 的成功具有战略重要性。它有力地证明了其 AI 实力，有助于推动其更广泛的云计算服务的采用。该公司一直在人工智能领域投入巨资，此次发布明确信号其志在成为该领域的全球领导者。该模型将成为其电子商务、广告和娱乐领域企业客户的关键产品，这些客户正在寻找大规模创作引人入胜内容的新方法。花旗集团对阿里巴巴（09988.HK）给出的 199 美元目标价表明，部分分析师看到了巨大的上涨潜力，而类似这样的新 AI 产品可能是实现这一潜力的关键因素。

本文仅供参考，不构成投资建议。