不仅更聪明,还要更好聊——AI竞赛正式进入“人性化”时代。
OpenAI于11月12日无预告发布了GPT-5的升级版本GPT-5.1系列模型,这是对今年8月发布的GPT-5的一次重大改进。新版本在自适应推理能力和对话自然度上实现了显著提升,同时为用户提供了更精细的个性化控制选项。
与此同时,谷歌的Gemini 3.0 Pro也已进入发布倒计时,一场AI巨头之间的对决即将上演。
GPT-5.1系列包含两个专门优化的模型:GPT-5.1 Instant和GPT-5.1 Thinking。
Instant模型作为默认且使用最广泛的版本,现在采用了更温暖、更对话式的风格。根据早期测试,它常常以轻松俏皮的交流方式让人惊喜,同时保持清晰和实用。
Thinking模型则是高级推理模型,能动态调整思考时间——简单任务响应速度提升约一倍,复杂任务则增加思考深度,确保答案更全面准确。
OpenAI应用业务负责人Fidji Simo指出,GPT-5.1与GPT-5最大的区别在于其更自然、更具对话性的语调。这一改进直接回应了用户对GPT-5语气过于僵硬的批评。
GPT-5.1最核心的技术升级是引入了自适应推理能力。
这意味着模型会自主判断问题的复杂程度,决定是否需要“深思熟虑”,而不再是对所有问题采用相同的处理方式。结果是简单问题更快回复,复杂问题更准确解答。
实际测试表明,这一技术改进带来了实实在在的性能提升。GPT-5.1在数学(AIME 2025)和编程(Codeforces)等基准测试中的表现显著优于前代产品。
对于用户而言,最直观的感受可能是GPT-5.1解释复杂概念时更“人话”了。它减少了专业术语和模糊表述,让非技术人员也能轻松理解。
面对超过8亿的月活跃用户,OpenAI认识到“单一默认设置已无法满足多样化需求”。
此次更新带来了八种预设对话风格:默认、友好、高效、专业、坦率、古怪,以及保留的愤世嫉俗和书呆子气选项。
更精细的是,用户现在可以微调ChatGPT的多个特征维度,包括回答的简洁度、语气温暖度、内容可读性以及表情符号使用频率。
这些个性化设置会立即在所有对话中生效,包括正在进行中的聊天,无需重新开启新对话。系统还能主动检测用户的风格偏好,并建议更新相关设置。
GPT-5.1采用分阶段推送策略:
对于开发者,API支持将于本周晚些时候推出。GPT-5.1 Instant将作为gpt-5.1-chat-latest提供,而GPT-5.1 Thinking将直接以gpt-5.1命名,两者都支持自适应推理。
gpt-5.1-chat-latest
gpt-5.1
现有的GPT-5系列模型将在下拉菜单中保留三个月,让付费用户有充足时间进行对比和过渡。
当OpenAI巩固其领先地位时,谷歌并未坐视不管。多个消息来源表明,Gemini 3.0 Pro已进入发布倒计时。
谷歌AI Studio已开始对Gemini 3进行受控的A/B测试,允许部分用户与模型互动并分享早期反馈。代码仓库中出现的“gemini-3-pro-preview-11-2025”字符串也暗示了发布时间点。
业内推测,Gemini 3.0可能带来以下改进:
谷歌有望在11月推出预览版,12月正式发布Gemini 3.0,这将是其对OpenAI的GPT-5.1的正式回应。
GPT-5.1的发布标志着AI竞赛进入新阶段——单纯的性能提升已不足够,人性化体验成为新战场。
经历了GPT-5发布后的争议,OpenAI显然听取了用户反馈。当时许多用户认为GPT-5虽然强大,但语气僵硬、缺乏“人味”,甚至有人形容其对话体验“像与一本百科全书交谈”。
此次更新后,社区反应积极。科技记者Tom Warren强调了新模型更“温暖”的特性,AI工程师Axel Darmouni对聊天机器人拥有“个性”和“更有同理心”的回应表示兴奋。
有用户总结称,这次更新“感觉更像GPT-4o”,对于不喜欢GPT-5的用户而言是“一个好回归”。
GPT-5.1的发布是OpenAI对用户反馈的直接回应,也预示着AI发展方向的转变:从单纯追求智商(IQ)到兼顾情商(EQ)的提升。
对于企业和开发者而言,新模型提供了更精细的控制能力,让AI能够更好地适应不同场景和品牌调性。
随着谷歌Gemini 3.0即将登场,AI巨头之间的竞争将更加激烈,而最终受益的将是全球用户。
资料来源:OpenAI官方发布、VentureBeat、CSDN、Investing等综合整理。