OpenAI 發佈新版圖像模型，推理能力提升 2 倍，瞄準專業用戶

OpenAI 週二推出了 ChatGPT Images 2.0，這是其圖像生成模型的重大升級，旨在通過增強複雜、數據驅動視覺效果的創建，並為付費用戶引入更強大的推理機制，來搶佔專業和企業市場。新模型可通過 ChatGPT 和 Codex API 使用，通過專注於教育工作者、科學家和企業客戶所需的結構化、高價值輸出，直接向 Anthropic 等競爭對手發起挑戰。

「我們將圖像生成視為 AI 的核心用例，」OpenAI 產品負責人 Adele Li 在媒體簡報中表示，「這次更新突破了結構化佈局和科學圖表的可能性邊界，為需要可視化複雜數據的專業人士開闢了新的應用場景。」

新模型為付費訂閱者引入了「深度思考」功能，該功能分配更多時間讓 AI 在生成圖像之前進行推理並進行網頁搜索，這一過程旨在提高複雜輸出的準確性和細節。此次更新還顯著提升了指令遵循、細節呈現和多語言文本渲染能力，並能夠生成高達 2K 分辨率的圖像。目前 OpenAI 的每週活躍用戶達數億，生成圖像超過 10 億張，此次更新代表了其有效變現龐大用戶群的一次重要嘗試。

此次發佈是 OpenAI 更廣泛戰略整合的一部分，該公司最近關閉了其 AI 視頻生成器 Sora，以將資源集中在 ChatGPT 和 Codex 等核心產品上。通過專注於企業需求並啟動 Codex Labs 等項目（將 OpenAI 專家嵌入組織內部），該公司正明確發力保護其市場份額，抵禦競爭對手，並為潛在的 IPO 鋪平道路。

更深層次的推理旨在提供企業級輸出

引入「深度思考」機制是對早期圖像生成模型一個關鍵弱點的直接回應：無法準確渲染圖表和科學圖表等複雜信息。通過允許模型在生成前分析上花費更多時間，OpenAI 旨在提供一種能夠超越創意提示，成為專業工作流程中必不可少工具的手段。這項能力至關重要，因為它可以與 Anthropic 的 Claude 模型競爭，後者因其強大的推理能力和專注於企業的部署而贏得了企業客戶的青睞。

此舉還與 OpenAI 最近擴大其 Codex 代理編程平台以供企業使用的努力相吻合。團隊正在使用 Codex 綜合來自各種工具的信息，並生成可操作的工作產出，如簡報和計劃。例如，在該生態系統內增強的圖像生成功能，可以讓工程團隊不僅生成項目計劃，還能在單一、統一的工作流中創建所有必要的技術圖表和演示幻燈片。

專注於變現與市場地位的戰略

ChatGPT Images 2.0 的發佈以及 Codex 企業版的同步規模化，標誌著 OpenAI 明確的戰略轉向。隨著 AI 市場的成熟，重心正從新奇的演示轉向能夠解決特定業務問題的可靠、產生收入的產品。目前有超過 400 萬開發者在使用 Codex，高於本月初的 300 萬，OpenAI 正在圍繞其開發者生態系統建立一道防禦護城河。

這種對企業採用和變現的關注，對於據傳正邁向 IPO 的公司來說至關重要。通過加強其付費產品並證明其核心產品企業價值，OpenAI 正在為投資者建立一個引人注目的案例。該戰略似乎奏效了，因為該公司成功地將其龐大的用戶群轉化為收入增長和市場領導地位的強大引擎，給競爭對手帶來了跟上步伐的壓力。

本文僅供參考，不構成投資建議。