阿里巴巴最新的視頻模型旨在覆蓋端到端創作工作流,此舉直接挑戰了 OpenAI 尚未發佈的 Sora 的各項能力。
返回
阿里巴巴最新的視頻模型旨在覆蓋端到端創作工作流,此舉直接挑戰了 OpenAI 尚未發佈的 Sora 的各項能力。

(P1) 阿里巴巴集團(9988.HK)推出了升級版的萬相 2.7-Video 生成模型,通過直接挑戰 OpenAI 備受期待的 Sora,加劇了人工智能領域的競爭。該新模型支持包括文本、圖像和音頻在內的多模態輸入,專注於從生成到最終編輯的整個創作工作流。這一功能組合旨在快速增長的生成式視頻市場中提供實用優勢。
(P2) 阿里巴巴在公告中表示:「該模型專注於整個創作工作流,涵蓋生成、編輯、複製、重塑、驅動、延續和參考等過程。」 這種對綜合性、一體化工具的強調,表明其戰略重點在於易用性和創作者控制力,而不僅僅是原始的生成能力。
(P3) 萬相 2.7-Video 允許用戶通過簡單的命令對視頻場景進行局部調整,編輯區域可與原始素材無縫整合。它支持根據文本指令或參考圖像添加或刪除元素、替換對象以及修改屬性。例如,背景可以從夏季改為秋季,或者將整個視頻風格轉換為羊毛氈效果,同時保持角色動作不變。這種顆粒度極高的控制力和風格轉換能力是其核心差異化優勢。
(P4) 此次發佈向包括 OpenAI 和谷歌在內的競爭對手施加了壓力,要求他們不僅要展示令人印象深刻的生成能力,還要展示一條通往用戶友好、商業化可行產品的清晰路徑。對於阿里巴巴而言,成功的視頻模型可以顯著提升其雲業務的吸引力,提供吸引並留住企業客戶的強大新工具。該公司股票目前的空頭頭寸比例高達 62.85%,如果該模型證明其商業價值,可能會重新贏得投資者的青睞。
阿里巴巴憑藉萬相 2.7-Video 進入高端生成式視頻領域,這對這家中國科技巨頭而言具有重大意義。雖然 OpenAI 的 Sora 以其超真實的視頻生成能力吸引了公眾的想象力,但它尚未向公眾發佈。阿里巴巴專注於從初始生成到詳細編輯的完整工作流,這可能使其在該技術的實際應用中獲得先發優勢。該模型能夠執行視頻的「補全」和「擴充」,以及保持風格和角色的一致性,這些都是專業創作者一直追求的功能。
該模型的多模態能力接受文本、圖像、視頻和音頻作為輸入,使其成為適用於廣泛創意應用的多功能工具。例如,用戶可以在同一個工作流中提供一段短視頻剪輯、一張風格參考圖和一段文本提示來修改場景內容。這種集成方法與創作者目前使用的零散工具鏈形成了鮮明對比,後者通常需要多個軟件配合才能完成不同的任務。
生成式 AI 市場正變得日益擁擠,各大科技巨頭和資金雄厚的初創公司都在爭奪主導地位。阿里巴巴的萬相 2.7-Video 不僅將與 OpenAI 的 Sora 競爭,還將面臨谷歌、Meta 以及 Runway 和 Pika 等初創公司的挑戰。關鍵的戰場可能不僅在於生成的視頻質量,還在於易用性、成本效益以及與現有創意工作流的集成程度。
對於阿里巴巴而言,萬相 2.7-Video 的成功具有戰略重要性。它有力地證明了其 AI 實力,有助於推動其更廣泛的雲計算服務的採用。該公司一直在人工智能領域投入巨資,此次發佈明確信號其志在成為該領域的全球領導者。該模型將成為其電子商務、廣告和娛樂領域企業客戶的關鍵產品,這些客戶正在尋找大規模創作引人入勝內容的新方法。花旗集團對阿里巴巴(09988.HK)給出的 199 美元目標價表明,部分分析師看到了巨大的上漲潛力,而類似這樣的新 AI 產品可能是實現這一潛力的關鍵因素。
本文僅供參考,不構成投資建議。