Claude Opus 4.5震撼发布:编程能力全球领先,价格大幅下调三分之二

Ai资讯5天前更新 大国Ai
40 0 0

2025年11月25日,美国人工智能公司Anthropic正式推出Claude Opus 4.5模型,在编程、智能体和计算机操作领域树立新标杆,同时实现价格大幅下调。

大国AI导航(daguoai.com) 北京时间11月25日消息,人工智能领域再次迎来重大更新。Anthropic公司今日正式发布Claude Opus 4.5,该模型被官方称为“世界上最好的编程、智能体和计算机操作模型”。最引人注目的是,其API价格相比前代产品大幅降低约三分之二,同时性能显著提升,标志着高端AI模型进入更普惠阶段。

价格策略重大调整,性价比显著提升

Claude Opus 4.5的API定价调整为输入5美元/百万tokens、输出25美元/百万tokens。与之前Opus 4.1的定价(输入15美元/百万tokens、输出75美元/百万tokens)相比,成本直接降低了三分之二

这一价格调整使得顶级AI模型的接入门槛大幅降低,开发者现在可以用更低的成本获得在多任务上超越前代旗舰的模型能力。价格调整后,Opus 4.5与Sonnet 4.5的定价差距进一步缩小,为开发者提供了更多选择。

Claude Opus 4.5震撼发布:编程能力全球领先,价格大幅下调三分之二

性能全面领先,编程能力突破

在权威编程基准测试SWE-bench Verified上,Opus 4.5取得了**80.9%**的当前最高分,超过了谷歌Gemini 3 Pro(76.2%)和OpenAI GPT-5.1-Codex-Max(77.9%)。

除了编程能力,Opus 4.5在智能体和计算机操作方面也表现卓越。在计算机使用基准测试OSWorld中,Opus 4.5达到66.3%的得分,显著优于前代Opus 4.1的44.4%。

值得注意的是,Opus 4.5展现了出色的创造性问题解决能力。在τ2-bench测试的航空公司客服场景中,它没有简单地拒绝乘客的基础经济舱改签请求,而是通过“先升舱再改签”的创新方式解决问题,展示了超越常规编程的推理能力。

产品功能升级,无限对话成为现实

Anthropic同时推出了名为“上下文压缩”(Context Compaction)的新功能。当对话长度达到限制时,系统会自动压缩前面内容,用户可以实现无限时长对话。

这一功能解决了长时间使用Claude时遇到的“上下文已达上限”问题,对于需要持续讨论复杂任务的用户来说尤为重要。此前,Claude Sonnet 4.5已经展示了连续工作30小时的能力,能够完全自主地编写代码,构建出类似Slack的聊天应用。

Claude Opus 4.5震撼发布:编程能力全球领先,价格大幅下调三分之二

安全性能提升,抗攻击能力增强

在安全方面,Opus 4.5成为Anthropic发布的“最安全、对齐最好的模型”。在抗提示注入攻击方面,它是目前所有主流大模型中表现最好的,显著降低了被“越狱”的风险。

安全训练的加强减少了模型的不良行为,如谄媚、欺骗等。同时,针对正常内容的误报也有所降低,正常请求拒绝率从Sonnet 4时的0.15%下降到了0.02%。

行业影响与未来展望

Claude Opus 4.5的发布进一步加剧了AI编程领域的竞争。此前,Claude Sonnet 4.5已经在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而Opus 4.5的到来将这一竞争推向了新的高度。

GitHub首席产品官Mario Rodriguez表示,Claude Sonnet 4.5让GitHub Copilot能更好地处理复杂的跨代码库任务。而Opus 4.5的推出,预计将进一步提升AI编程助力的能力上限。

随着谷歌Gemini 3和OpenAI GPT 5.1的相继发布,AI大模型领域的竞争日趋白热化。Claude Opus 4.5的性价比提升和性能突破,为开发者提供了更具吸引力的选择,也将推动整个行业向更高效、更实用的方向发展。


资料来源:大国AI导航(daguoai.com)综合自Anthropic官方发布及公开报道
责任编辑:刘伟

© 版权声明

相关文章

暂无评论

none
暂无评论...