OpenAI发布GPT Image 1.5,图像生成进入“精准编辑”时代

Ai资讯2周前发布 大国Ai
119 0 0

摘要: 北京时间2025年12月17日,OpenAI正式推出全新图像生成模型GPT Image 1.5,并全面升级ChatGPT中的图像功能。新模型以“精准编辑、细节保留”为核心,生成速度提升4倍,并新增独立“Images”创作空间。OpenAI首席执行官山姆·奥特曼(Sam Altman)亲自下场,通过社交媒体发布由新模型生成的“消防员写真”进行宣传,引发广泛关注与讨论。该功能现已面向全球ChatGPT用户开放,API价格较上一代下降20%。

OpenAI发布GPT Image 1.5,图像生成进入“精准编辑”时代

一、 核心升级:从“生成”到“可编辑”的质变

OpenAI此次发布并非简单迭代,而是对其图像能力的系统性重塑。驱动新功能的旗舰模型被命名为GPT Image 1.5,其最显著的突破在于编辑一致性与指令遵循能力的大幅提升。

与以往“改一处、乱一片”的体验不同,新模型能够精准识别用户意图,在添加、移除、组合或移位图像元素时,确保光线、构图、人物外观等关键细节在多轮编辑中保持高度一致。这意味着用户可以进行更实用的照片修饰、逼真的虚拟试装,或在保留原图精髓的基础上进行风格转换,真正实现“所想即所得”。OpenAI将这一能力形容为将ChatGPT变成了一个随身携带的“迷你修图工作室”。

二、 产品化整合:独立入口与体验优化

除了模型能力,OpenAI对产品形态进行了重要调整。在ChatGPT网页端和移动应用的侧边栏,新增了独立的 “Images”入口,将其打造为一个专注于视觉创作的独立空间。

该界面内置了数十种预设滤镜和热门提示词(如“素描”、“假日照片”、“制作贺卡”等),用户无需编写复杂提示即可快速上手,探索灵感。OpenAI应用业务负责人菲吉·西莫(Fidji Simo)表示,这一改变旨在将图像创作从原本基于文本的对话流程中解放出来,提供一个真正的“创意工作室”。

三、 性能与可用性:速度提升,成本下降

根据官方信息,GPT Image 1.5的图像生成速度最高可达上一代模型的4倍,从“等待结果”转向更接近实时反馈。实测显示,此前GPT-4o生成图像可能需要等待10分钟左右,而新模型可在1分钟内完成,体验提升明显。

在可用性方面,新功能已开始向所有ChatGPT用户(包括免费用户)陆续开放,并同步通过API发布。值得注意的是,今年3月该功能首次推出时,曾因需求远超预期而推迟向免费用户开放,此次全面开放显示了OpenAI推广该功能的决心。同时,API的图像输入输出成本较上一代(GPT Image 1)降低了约20%,为开发者和企业用户的规模化应用提供了条件。

四、 技术团队与战略意图

此次发布也揭示了OpenAI在多模态领域的战略布局。项目由Gabriel Goh和Adele Li分别担任研发与产品负责人。更引人注目的是,领导层名单中出现了Sora负责人Bill Peebles和DALL-E系列缔造者之一Aditya Ramesh的名字。业界分析认为,这强烈暗示新版图像功能可能在底层借鉴了Sora的“世界模拟”技术,或是在为未来图像与视频生成的无缝切换做技术铺垫。

OpenAI还组建了庞大的“安全、诚信与策略”团队,由二十余名专家负责内容过滤与防止滥用,显示出在追求技术突破的同时,对产品安全与社会责任的高度重视。

五、 市场反响与竞品对比

新模型发布后,迅速在AI社区引发热议。山姆·奥特曼在社交平台X上发布了一张由GPT Image 1.5生成的个人“消防员”主题日历图进行宣传,该图因奥特曼半裸出镜的造型迅速引爆网络,互动量甚至超过了官方发布主帖。网友纷纷使用新功能为其“穿上衣服”,OpenAI官方账号也下场互动,形成了独特的营销事件。

在模型能力层面,权威测评网站Artificial Analysis的数据显示,GPT Image 1.5在文生图和图像编辑榜单上均位列第一,超越了谷歌的Nano Banana Pro。其指令遵循率据称高达90%。不过,也有评测指出,新模型在画面真实感、复杂细节(如人体结构、多物体关系)的准确性上,与Nano Banana Pro相比仍有差距,存在画面“油腻感”、部分细节错误等问题。例如,在生成复杂场景时,可能出现人物与背景融合不自然、手指数量错误等情况。

六、 未来展望:从工具到创意环境

OpenAI在官方博文中强调,此次更新是向稳定性、可复用性与可交付性迈进的关键一步。菲吉·西莫撰文指出,ChatGPT正在从“以文本为中心的对话工具”转向“以任务与创作为中心的生成式界面”。图像能力的深度集成与体验优化,是重新思考人机交互方式的重要环节。

未来,OpenAI表示将继续专注于更细粒度的编辑、视觉一致性以及多语言支持等方面的改进。随着GPT Image 1.5的推出,AI图像生成的竞争焦点,正从纯粹的模型能力比拼,转向包含产品体验、工作流整合和成本效率在内的综合实力较量。


文章来源:本文综合自OpenAI官方公告及多家科技媒体于2025年12月17日的报道,包括机器之心、腾讯新闻、搜狐科技等,核心信息均来源于OpenAI官方发布。

© 版权声明

相关文章

暂无评论

none
暂无评论...