OpenAI发布GPT Image 1.5，图像生成进入“精准编辑”时代

摘要： 北京时间2025年12月17日，OpenAI正式推出全新图像生成模型GPT Image 1.5，并全面升级ChatGPT中的图像功能。新模型以“精准编辑、细节保留”为核心，生成速度提升4倍，并新增独立“Images”创作空间。OpenAI首席执行官山姆·奥特曼（Sam Altman）亲自下场，通过社交媒体发布由新模型生成的“消防员写真”进行宣传，引发广泛关注与讨论。该功能现已面向全球ChatGPT用户开放，API价格较上一代下降20%。

一、核心升级：从“生成”到“可编辑”的质变

OpenAI此次发布并非简单迭代，而是对其图像能力的系统性重塑。驱动新功能的旗舰模型被命名为GPT Image 1.5，其最显著的突破在于编辑一致性与指令遵循能力的大幅提升。

与以往“改一处、乱一片”的体验不同，新模型能够精准识别用户意图，在添加、移除、组合或移位图像元素时，确保光线、构图、人物外观等关键细节在多轮编辑中保持高度一致。这意味着用户可以进行更实用的照片修饰、逼真的虚拟试装，或在保留原图精髓的基础上进行风格转换，真正实现“所想即所得”。OpenAI将这一能力形容为将ChatGPT变成了一个随身携带的“迷你修图工作室”。

二、产品化整合：独立入口与体验优化

除了模型能力，OpenAI对产品形态进行了重要调整。在ChatGPT网页端和移动应用的侧边栏，新增了独立的 “Images”入口，将其打造为一个专注于视觉创作的独立空间。

该界面内置了数十种预设滤镜和热门提示词（如“素描”、“假日照片”、“制作贺卡”等），用户无需编写复杂提示即可快速上手，探索灵感。OpenAI应用业务负责人菲吉·西莫（Fidji Simo）表示，这一改变旨在将图像创作从原本基于文本的对话流程中解放出来，提供一个真正的“创意工作室”。

三、性能与可用性：速度提升，成本下降

根据官方信息，GPT Image 1.5的图像生成速度最高可达上一代模型的4倍，从“等待结果”转向更接近实时反馈。实测显示，此前GPT-4o生成图像可能需要等待10分钟左右，而新模型可在1分钟内完成，体验提升明显。

在可用性方面，新功能已开始向所有ChatGPT用户（包括免费用户）陆续开放，并同步通过API发布。值得注意的是，今年3月该功能首次推出时，曾因需求远超预期而推迟向免费用户开放，此次全面开放显示了OpenAI推广该功能的决心。同时，API的图像输入输出成本较上一代（GPT Image 1）降低了约20%，为开发者和企业用户的规模化应用提供了条件。

四、技术团队与战略意图

此次发布也揭示了OpenAI在多模态领域的战略布局。项目由Gabriel Goh和Adele Li分别担任研发与产品负责人。更引人注目的是，领导层名单中出现了Sora负责人Bill Peebles和DALL-E系列缔造者之一Aditya Ramesh的名字。业界分析认为，这强烈暗示新版图像功能可能在底层借鉴了Sora的“世界模拟”技术，或是在为未来图像与视频生成的无缝切换做技术铺垫。

OpenAI还组建了庞大的“安全、诚信与策略”团队，由二十余名专家负责内容过滤与防止滥用，显示出在追求技术突破的同时，对产品安全与社会责任的高度重视。

五、市场反响与竞品对比

新模型发布后，迅速在AI社区引发热议。山姆·奥特曼在社交平台X上发布了一张由GPT Image 1.5生成的个人“消防员”主题日历图进行宣传，该图因奥特曼半裸出镜的造型迅速引爆网络，互动量甚至超过了官方发布主帖。网友纷纷使用新功能为其“穿上衣服”，OpenAI官方账号也下场互动，形成了独特的营销事件。

在模型能力层面，权威测评网站Artificial Analysis的数据显示，GPT Image 1.5在文生图和图像编辑榜单上均位列第一，超越了谷歌的Nano Banana Pro。其指令遵循率据称高达90%。不过，也有评测指出，新模型在画面真实感、复杂细节（如人体结构、多物体关系）的准确性上，与Nano Banana Pro相比仍有差距，存在画面“油腻感”、部分细节错误等问题。例如，在生成复杂场景时，可能出现人物与背景融合不自然、手指数量错误等情况。

六、未来展望：从工具到创意环境

OpenAI在官方博文中强调，此次更新是向稳定性、可复用性与可交付性迈进的关键一步。菲吉·西莫撰文指出，ChatGPT正在从“以文本为中心的对话工具”转向“以任务与创作为中心的生成式界面”。图像能力的深度集成与体验优化，是重新思考人机交互方式的重要环节。

未来，OpenAI表示将继续专注于更细粒度的编辑、视觉一致性以及多语言支持等方面的改进。随着GPT Image 1.5的推出，AI图像生成的竞争焦点，正从纯粹的模型能力比拼，转向包含产品体验、工作流整合和成本效率在内的综合实力较量。

文章来源：本文综合自OpenAI官方公告及多家科技媒体于2025年12月17日的报道，包括机器之心、腾讯新闻、搜狐科技等，核心信息均来源于OpenAI官方发布。

Ai资讯 # GPT Image 1.5

文章版权归作者所有，未经允许请勿转载。

OpenAI发布GPT Image 1.5，图像生成进入“精准编辑”时代

一、核心升级：从“生成”到“可编辑”的质变

二、产品化整合：独立入口与体验优化

三、性能与可用性：速度提升，成本下降

四、技术团队与战略意图

五、市场反响与竞品对比

六、未来展望：从工具到创意环境

小米发布开源大模型MiMo-V2-Flash：以“极致性价比”杀入AI竞赛，剑指人车家全生态

OpenAI发布GPT Image 1.5：图像生成迎来精准编辑时代，免费用户全面开放

相关文章

MiniMax M2.1重磅发布：多语言编程能力登顶，开启AI原生开发新纪元

AI革新电商生产力：白底图+多维表格构建详情页“智能工厂”

Claude in Excel深度评测：重塑办公自动化，企业级AI的“Excel时刻”已至

百度文心App“魔法漫画”体验：一句话一张图，两分钟唤醒你的漫画梦

暂无评论

最新文章

OpenAI发布GPT Image 1.5，图像生成进入“精准编辑”时代

一、 核心升级：从“生成”到“可编辑”的质变

二、 产品化整合：独立入口与体验优化

三、 性能与可用性：速度提升，成本下降

四、 技术团队与战略意图

五、 市场反响与竞品对比

六、 未来展望：从工具到创意环境

小米发布开源大模型MiMo-V2-Flash：以“极致性价比”杀入AI竞赛，剑指人车家全生态

OpenAI发布GPT Image 1.5：图像生成迎来精准编辑时代，免费用户全面开放

相关文章

MiniMax M2.1重磅发布：多语言编程能力登顶，开启AI原生开发新纪元

AI革新电商生产力：白底图+多维表格构建详情页“智能工厂”

Claude in Excel深度评测：重塑办公自动化，企业级AI的“Excel时刻”已至

百度文心App“魔法漫画”体验：一句话一张图，两分钟唤醒你的漫画梦

暂无评论

最新文章

标签云

一、核心升级：从“生成”到“可编辑”的质变

二、产品化整合：独立入口与体验优化

三、性能与可用性：速度提升，成本下降

四、技术团队与战略意图

五、市场反响与竞品对比

六、未来展望：从工具到创意环境