OpenAI 的新型圖像模型可以從網路獲取即時信息,這對現有的設計軟體巨頭構成了直接挑戰。
返回
OpenAI 的新型圖像模型可以從網路獲取即時信息,這對現有的設計軟體巨頭構成了直接挑戰。

OpenAI 的新型圖像模型可以從網路獲取即時信息,這對現有的設計軟體巨頭構成了直接挑戰。
OpenAI 發佈了 ChatGPT Images 2.0,這是一款新型生成式 AI 模型,可以在生成高達 2K 分辨率的圖像之前在網上搜索信息。此舉直接針對創意專業人士的工作流程,並挑戰了 Adobe Inc. 等既有巨頭的霸主地位。
Tom’s Guide 的撰稿人 Amanda Caswell 寫道:「這是 ChatGPT 圖像升級第一次讓人覺得,重點不再是讓圖像走紅,而是為了完成實際的工作。」
這款新模型面向所有 ChatGPT 用戶開放,改進了包括日語和印地語在內的多種語言的文本渲染,並支持從 3:1 到 1:3 的更廣泛長寬比。付費訂閱者可以獲得「思考」能力,使模型能夠根據單個提示生成多達八張一致的圖像,並在渲染前推敲圖像的結構。
此次發佈加劇了數十億美元創意軟體市場的競爭。由於投資者對其 AI 策略感到擔憂,Adobe 的股價今年已下跌約 25%。隨著生成式工具現在能夠生產商業級內容,既有企業正面臨證明其價值的壓力,以對抗來自 AI 原生公司日益強大且易於獲取的模型。
OpenAI 將 Images 2.0 定位為設計和營銷專業人士的實用工具。該公司聲稱,該模型能夠在一系列圖像中保持角色和風格的一致性,使其適合直接在 ChatGPT 介面內創建分鏡腳本、社交媒體活動和產品原型。這直接與長期以來作為行業標準的專業設計軟體展開競爭。
改進的文本生成是一個關鍵的差異化因素。過去的 AI 圖像模型在渲染連貫文本方面一直很吃力,這是商業用途的一個重大限制。PCWorld 的 Ben Patterson 測試了新模型,並指出其在渲染文本方面具有「非凡的準確性」,甚至是手寫風格,這為創建具有近乎完美文本準確性的目錄和信息圖表開辟了實際應用空間。
該模型由新的 GPT-Image-2 架構驅動,其知識庫更新至 2025 年 12 月。它提供兩種模式:面向所有用戶的「即時」模式,以及面向 Plus、Pro 和 Enterprise 等付費計劃訂閱者的「思考」模式。
此次發佈正值生成式 AI 領域的競爭持續加速之際。谷歌擁有 Nano Banana Pro 模型,而 OpenAI 的關鍵合作夥伴和投資者微軟則擁有自己的 MAI-Image-2。此舉也給 Adobe 等公司帶來了壓力,Adobe 最近展示了其以企業為中心的 AI 代理策略,但未能說服投資者其防禦能力,其股價在 213 歐元附近交易,遠低於其 374 歐元的 52 周高點。
在另一份公告中,OpenAI 正在通過 Codex Labs 擴展其企業產品,這是一項旨在幫助公司將 Codex AI 編程助手集成到其工作流程中的新服務。該計劃將提供實操研討會,幫助組織部署該工具,將其連接到現有軟體,旨在將其轉變為開發者的集中式「超級應用」。
這種對創意和開發者工具雙重關注標誌著 OpenAI 的策略,即深化其技術在核心業務運營中的嵌入,從面向消費者的聊天機器人轉向不可或缺的企業平台。
本文僅供參考,不構成投資建議。