摘要:5月6日,OpenAI悄然上线了全新的默认模型GPT-5.5 Instant,免费用户即刻可用。本次升级直击大模型两大痛点:在医疗、法律等高风险领域的“幻觉”率暴降52.5%,同时大幅优化了输出风格,砍掉冗长的“废话文学”,回复单词数减少超30%。此外,新增的“记忆溯源”功能让AI的个性化建议不再是一本糊涂账,用户可随时查看、修改或删除AI调用的记忆来源。
就在刚刚,奥特曼在推特上忍不住安利了一句:“如果你最近一直只用深度思考模型,不妨回来试试新版Instant!”
没开玩笑,这次ChatGPT的默认模型更新,确实有点东西。
从GPT-4o退役时引发的用户“失恋式”抗议,到现在大家苦“废话文学”和“一本正经胡说八道”久矣,OpenAI显然听到了吐槽。新上线的GPT-5.5 Instant,替代了之前的GPT-5.3 Instant,主打一个“更准、更短、更懂你”[webpage 2]。作为大国Ai导航(daguoai.com)的深度体验官,我帮大家把这次的干货都扒出来了。
对于每天把ChatGPT当搜索引擎甚至顾问的人来说,最怕的不是它不会,而是它“自信满满地胡说八道”。尤其是在看合同、查代码、问诊这些高危场景,一个幻觉可能就是几万块的损失。
这次OpenAI第一刀就砍在了幻觉上。据官方数据,GPT-5.5 Instant在医疗、法律和金融等高风险提示中,产生的虚假陈述直接减少了52.5%;而在那些已经被用户标记过有事实错误的“雷区对话”里,不准确陈述也下降了37.3%[webpage 1][webpage 3]。
举个极其直观的例子:当用户上传了一张有计算错误的手写代数方程时,老版GPT-5.3 Instant顺着用户的错误算下去,发现结果不对,居然直接得出结论“该方程无解”——典型的用另一个错误掩盖上一个错误。而GPT-5.5 Instant不仅在代入后发现不对劲,还能倒退回步骤,精准揪出用户在展开方程式时的笔误(把x²-3x-6写成了x²-x-6),并给出正确的求根结果[webpage 1][webpage 3]。这种“自我纠错”的推演能力,才是真正让人放心的助手底色。
硬核基准测试也印证了这点:AIME 2025数学竞赛准确率从65.4%飙到81.2%;博士级科学推理GPQA从78.5%涨至85.6%;多模态专家级测试MMMU-Pro也从69.2%升至76.0%[webpage 1][webpage 2]。智商在线,是这次升级的底气。
以前用ChatGPT,问个“怎么跟同事说别来打扰我”,它能给你整出一大段免责声明、三层排比列表,外加一堆😅🙏表情包,最后还不忘问你“需要我继续提供帮助吗?”——信息密度极低,看得人脑仁疼。
GPT-5.5 Instant在风格上做了大手术:减少过度排版、砍掉无意义的追问、省去泛滥的表情符号[webpage 2]。同样是回答职场建议,新版的单词数减少了30.2%,行数减少了29.2%[webpage 1][webpage 3]。
它现在的语气更像是一个懂分寸的职场老鸟:非正式、实用、对事不对人。没有爹味说教,没有过度润色,直接给你几句能拿来就用的口语化话术。OpenAI自己也反思了,老版本虽然在“不该做什么”上写得很全,但对于日常非正式提问来说,显得太重、太啰嗦了[webpage 3]。
这次更新最戳我的一点,是“记忆”功能的进化。GPT-5.5 Instant现在能更聪明地调用你过去的聊天记录、上传的文件,甚至是关联的Gmail邮箱内容[webpage 3]。关键在于,它学会了“看场合”——不是每次都硬套记忆,而是判断什么时候调用上下文能让回答更好。
比如你问“推荐几家新开的茶馆”,老版会给你一份烂大街的打卡榜单;而新版则会结合你之前提过的口味偏好,直接给你三个定向推荐,还会贴心地标明“这家适合带电脑去码字,那家适合爬山后放松”[webpage 3]。
更绝的是**“记忆来源”(Memory Sources)功能**的上线。AI突然懂你了,你不觉得瘆得慌吗?现在,ChatGPT会明确告诉你:我之所以这么回答,是因为调用了你哪天的聊天记录,或者你保存在我这里的哪条偏好[webpage 1][webpage 2]。如果信息过时了,你还可以直接点“不相关”或删除修改。当你把对话链接分享给别人时,你的记忆来源是默认隐藏的,隐私安全感拉满[webpage 2][webpage 3]。这也算是OpenAI在吸取了当年GPT-4o因“性格太好”让用户产生情感依赖并引发退役抗议的教训后,给出的一种更透明、更健康的解题思路[webpage 2]。
GPT-5.5 Instant从5月5日起已经开始向所有ChatGPT用户滚动上线,免费用户也能直接体验。对于开发者,API端口已更新为chat-latest[webpage 1]。
chat-latest
需要注意的是,旧版GPT-5.3 Instant不会立刻消失,付费用户还能在设置里切回老版用三个月,之后才彻底退役。至于个性化增强和记忆溯源功能,目前正在向Plus和Pro网页端用户优先推送,移动端和Free、Business等版本会在未来几周内陆续跟上[webpage 1][webpage 2]。
总的来说,从GPT-4o到GPT-5系列,ChatGPT正在努力褪去“花哨的玩具”属性,向着真正可靠的“生产力协作者”进化[webpage 8]。少点幻觉,少点废话,多点真诚——这才是一个合格AI助手该有的样子。
文章来源: