MAI-Image-2首次亮相便位列第三,微軟AI戰略轉向
微軟發布了第二代內部AI圖像模型MAI-Image-2,該模型在Arena.ai文本到圖像排行榜上首次亮相便位列第三。這一排名使微軟的專有技術僅次於谷歌和OpenAI的模型,確立了該公司在其此前外包的市場領域中成為一個強大的競爭者。這與一年前微軟產品(如Bing圖像創建器和Copilot)幾乎完全由OpenAI的DALL-E模型提供支持的情況形成了鮮明對比。新模型現已開始在這些微軟平台中推廣。
這項開發來自穆斯塔法·蘇萊曼領導的微軟AI超智能團隊。MAI-Image-1於2025年10月推出,其繼任者僅在五個月後便發布,這種快速進展突顯了微軟加速建構專有AI技術棧的決心。此舉使微軟能夠按照自己的條件進行迭代,並減少對外部合作夥伴的戰略依賴。
強大的性能因產品限制而受挫
獨立測試顯示,MAI-Image-2的技術能力非常強大,特別是在照片真實感和圖像內生成清晰可讀文本方面——這對於許多競爭模型來說是一個已知的弱點。該模型展現了對自然光線、紋理和複雜場景構圖的強大理解。在一些測試中,其在文本渲染和圖像質量方面的輸出甚至超越了行業基準中排名更高的模型。
然而,這些技術優勢目前受到顯著產品限制的制約。在公共MAI Playground中測試該模型的用戶面臨嚴格的每日15張圖像生成限制,並且每張圖像之間需要30秒的冷卻時間。此外,該模型僅限於1:1的正方形長寬比,並缺乏像圖像修復或圖像到圖像生成等高級編輯功能。在目前的形式下,這些限制使其不適用於專業或大批量的工作流程。
內部模型預示著削減成本和減少AI依賴的趨勢
開發一款有競爭力的內部AI模型是微軟的一項明確戰略舉措,旨在增強其對AI部門的長期財務和運營控制。通過減少對OpenAI等合作夥伴的第三方模型許可依賴,微軟可以顯著削減大規模運營支出。擁有從新的英偉達GB200計算集群到模型本身的全棧技術,賦予了該公司在產品開發、安全政策和未來整合方面的完全自主權。
對於投資者而言,這一轉變表明微軟致力於從AI熱潮中獲取更多價值。儘管MAI-Image-2目前是一個有前途的技術基礎,但受到保守產品決策的阻礙,它預示著未來微軟將能夠在其企業和消費產品中部署功能強大、成本效益高的AI,而無需分享收入或控制權。其開發速度表明,一旦這些初始限制解除,微軟的圖像生成工具將成為嚴肅的市場競爭者。