OpenAI 发布新版图像模型，推理能力提升 2 倍，瞄准专业用户

OpenAI 周二推出了 ChatGPT Images 2.0，这是其图像生成模型的重大升级，旨在通过增强复杂、数据驱动视觉效果的创建，并为付费用户引入更强大的推理机制，来抢占专业和企业市场。新模型可通过 ChatGPT 和 Codex API 使用，通过专注于教育工作者、科学家和企业客户所需的结构化、高价值输出，直接向 Anthropic 等竞争对手发起挑战。

“我们将图像生成视为 AI 的核心用例，”OpenAI 产品负责人 Adele Li 在媒体简报中表示，“这次更新突破了结构化布局和科学图表的可能性边界，为需要可视化复杂数据的专业人士开辟了新的应用场景。”

新模型为付费订阅者引入了“深度思考”功能，该功能分配更多时间让 AI 在生成图像之前进行推理并进行网页搜索，这一过程旨在提高复杂输出的准确性和细节。此次更新还显着提升了指令遵循、细节呈现和多语言文本渲染能力，并能够生成高达 2K 分辨率的图像。目前 OpenAI 的每周活跃用户达数亿，生成图像超过 10 亿张，此次更新代表了其有效变现庞大用户群的一次重要尝试。

此次发布是 OpenAI 更广泛战略整合的一部分，该公司最近关闭了其 AI 视频生成器 Sora，以将资源集中在 ChatGPT 和 Codex 等核心产品上。通过专注于企业需求并启动 Codex Labs 等项目（将 OpenAI 专家嵌入组织内部），该公司正明确发力保护其市场份额，抵御竞争对手，并为潜在的 IPO 铺平道路。

更深层次的推理旨在提供企业级输出

引入“深度思考”机制是对早期图像生成模型一个关键弱点的直接回应：无法准确渲染图表和科学图表等复杂信息。通过允许模型在生成前分析上花费更多时间，OpenAI 旨在提供一种能够超越创意提示，成为专业工作流程中必不可少工具的手段。这项能力至关重要，因为它可以与 Anthropic 的 Claude 模型竞争，后者因其强大的推理能力和专注于企业的部署而赢得了企业客户的青睐。

此举还与 OpenAI 最近扩大其 Codex 代理编程平台以供企业使用的努力相吻合。团队正在使用 Codex 综合来自各种工具的信息，并生成可操作的工作产出，如简报和计划。例如，在该生态系统内增强的图像生成功能，可以让工程团队不仅生成项目计划，还能在单一、统一的工作流中创建所有必要的技术图表和演示幻灯片。

专注于变现与市场地位的战略

ChatGPT Images 2.0 的发布以及 Codex 企业版的同步规模化，标志着 OpenAI 明确的战略转向。随着 AI 市场的成熟，重心正从新奇的演示转向能够解决特定业务问题的可靠、产生收入的产品。目前有超过 400 万开发者在使用 Codex，高于本月初的 300 万，OpenAI 正在围绕其开发者生态系统建立一道防御护城河。

这种对企业采用和变现的关注，对于据传正迈向 IPO 的公司来说至关重要。通过加强其付费产品并证明其核心产品的企业价值，OpenAI 正在为投资者建立一个引人注目的案例。该战略似乎奏效了，因为该公司成功地将其庞大的用户群转化为收入增长和市场领导地位的强大引擎，给竞争对手带来了跟上步伐的压力。

本文仅供参考，不构成投资建议。