OpenAI 的新型图像模型可以从网络获取实时信息,这对现有的设计软件巨头构成了直接挑战。
返回
OpenAI 的新型图像模型可以从网络获取实时信息,这对现有的设计软件巨头构成了直接挑战。

OpenAI 的新型图像模型可以从网络获取实时信息,这对现有的设计软件巨头构成了直接挑战。
OpenAI 发布了 ChatGPT Images 2.0,这是一款新型生成式 AI 模型,可以在生成高达 2K 分辨率的图像之前在网上搜索信息。此举直接针对创意专业人士的工作流程,并挑战了 Adobe Inc. 等既有巨头的霸主地位。
Tom’s Guide 的撰稿人 Amanda Caswell 写道:“这是 ChatGPT 图像升级第一次让人觉得,重点不再是让图像走红,而是为了完成实际的工作。”
这款新模型面向所有 ChatGPT 用户开放,改进了包括日语和印地语在内的多种语言的文本渲染,并支持从 3:1 到 1:3 的更广泛长宽比。付费订阅者可以获得“思考”能力,使模型能够根据单个提示生成多达八张一致的图像,并在渲染前推敲图像的结构。
此次发布加剧了数十亿美元创意软件市场的竞争。由于投资者对其 AI 战略感到担忧,Adobe 的股价今年已下跌约 25%。随着生成式工具现在能够生产商业级内容,既有企业正面临证明其价值的压力,以对抗来自 AI 原生公司日益强大且易于获取的模型。
OpenAI 将 Images 2.0 定位为设计和营销专业人士的实用工具。该公司声称,该模型能够在一系列图像中保持角色和风格的一致性,使其适合直接在 ChatGPT 界面内创建分镜脚本、社交媒体活动和产品原型。这直接与长期以来作为行业标准的专业设计软件展开竞争。
改进的文本生成是一个关键的差异化因素。过去的 AI 图像模型在渲染连贯文本方面一直很吃力,这是商业用途的一个重大限制。PCWorld 的 Ben Patterson 测试了新模型,并指出其在渲染文本方面具有“非凡的准确性”,甚至是手写风格,这为创建具有近乎完美文本准确性的目录和信息图表开辟了实际应用空间。
该模型由新的 GPT-Image-2 架构驱动,其知识库更新至 2025 年 12 月。它提供两种模式:面向所有用户的“即时”模式,以及面向 Plus、Pro 和 Enterprise 等付费计划订阅者的“思考”模式。
此次发布正值生成式 AI 领域的竞争持续加速之际。谷歌拥有 Nano Banana Pro 模型,而 OpenAI 的关键合作伙伴和投资者微软则拥有自己的 MAI-Image-2。此举也给 Adobe 等公司带来了压力,Adobe 最近展示了其以企业为中心的 AI 代理战略,但未能说服投资者其防御能力,其股价在 213 欧元附近交易,远低于其 374 欧元的 52 周高点。
在另一份公告中,OpenAI 正在通过 Codex Labs 扩展其企业产品,这是一项旨在帮助公司将 Codex AI 编程助手集成到其工作流程中的新服务。该计划将提供实操研讨会,帮助组织部署该工具,将其连接到现有软件,旨在将其转变为开发者的集中式“超级应用”。
这种对创意和开发者工具的双重关注标志着 OpenAI 的战略,即深化其技术在核心业务运营中的嵌入,从面向消费者的聊天机器人转向不可或缺的企业平台。
本文仅供参考,不构成投资建议。