阿里巴巴最新的视频模型旨在覆盖端到端创作工作流,此举直接挑战了 OpenAI 尚未发布的 Sora 的各项能力。
返回
阿里巴巴最新的视频模型旨在覆盖端到端创作工作流,此举直接挑战了 OpenAI 尚未发布的 Sora 的各项能力。

(P1) 阿里巴巴集团(9988.HK)推出了升级版的万相 2.7-Video 生成模型,通过直接挑战 OpenAI 备受期待的 Sora,加剧了人工智能领域的竞争。该新模型支持包括文本、图像和音频在内的多模态输入,专注于从生成到最终编辑的整个创作工作流。这一功能组合旨在快速增长的生成式视频市场中提供实用优势。
(P2) 阿里巴巴在公告中表示:“该模型专注于整个创作工作流,涵盖生成、编辑、复制、重塑、驱动、延续和参考等过程。” 这种对综合性、一体化工具的强调,表明其战略重点在于易用性和创作者控制力,而不仅仅是原始的生成能力。
(P3) 万相 2.7-Video 允许用户通过简单的命令对视频场景进行局部调整,编辑区域可与原始素材无缝整合。它支持根据文本指令或参考图像添加或删除元素、替换对象以及修改属性。例如,背景可以从夏季改为秋季,或者将整个视频风格转换为羊毛毡效果,同时保持角色动作不变。这种颗粒度极高的控制力和风格转换能力是其核心差异化优势。
(P4) 此次发布向包括 OpenAI 和谷歌在内的竞争对手施加了压力,要求他们不仅要展示令人印象深刻的生成能力,还要展示一条通往用户友好、商业化可行产品的清晰路径。对于阿里巴巴而言,成功的视频模型可以显著提升其云业务的吸引力,提供吸引并留住企业客户的强大新工具。该公司股票目前的空头头寸比例高达 62.85%,如果该模型证明其商业价值,可能会重新赢得投资者的青睐。
阿里巴巴凭借万相 2.7-Video 进入高端生成式视频领域,这对这家中国科技巨头而言具有重大意义。虽然 OpenAI 的 Sora 以其超真实的视频生成能力吸引了公众的想象力,但它尚未向公众发布。阿里巴巴专注于从初始生成到详细编辑的完整工作流,这可能使其在该技术的实际应用中获得先发优势。该模型能够执行视频的“补全”和“扩充”,以及保持风格和角色的一致性,这些都是专业创作者一直追求的功能。
该模型的多模态能力接受文本、图像、视频和音频作为输入,使其成为适用于广泛创意应用的多功能工具。例如,用户可以在同一个工作流中提供一段短视频剪辑、一张风格参考图和一段文本提示来修改场景内容。这种集成方法与创作者目前使用的零散工具链形成了鲜明对比,后者通常需要多个软件配合才能完成不同的任务。
生成式 AI 市场正变得日益拥挤,各大科技巨头和资金雄厚的初创公司都在争夺主导地位。阿里巴巴的万相 2.7-Video 不仅将与 OpenAI 的 Sora 竞争,还将面临谷歌、Meta 以及 Runway 和 Pika 等初创公司的挑战。关键的战场可能不仅在于生成的视频质量,还在于易用性、成本效益以及与现有创意工作流的集成程度。
对于阿里巴巴而言,万相 2.7-Video 的成功具有战略重要性。它有力地证明了其 AI 实力,有助于推动其更广泛的云计算服务的采用。该公司一直在人工智能领域投入巨资,此次发布明确信号其志在成为该领域的全球领导者。该模型将成为其电子商务、广告和娱乐领域企业客户的关键产品,这些客户正在寻找大规模创作引人入胜内容的新方法。花旗集团对阿里巴巴(09988.HK)给出的 199 美元目标价表明,部分分析师看到了巨大的上涨潜力,而类似这样的新 AI 产品可能是实现这一潜力的关键因素。
本文仅供参考,不构成投资建议。