摘要:近期,大量开发者发现其AI编程助手Claude Code(特别是Opus 4.6模型)出现明显的性能下降,表现为思考草率、代码错误增多,这一现象被社区称为“降智”。根据AMD AI总监对超过6800次会话的数据分析,模型的平均思考深度下降了约67%。本文将科普这一现象背后的技术原因(主要是Anthropic为控制成本引入的“自适应思考”机制),并提供一套经过验证的配置方案与使用习惯,帮助用户有效缓解降智问题并显著节省Token消耗。
近期,从普通开发者到AMD的AI团队,都明显感觉到Claude,尤其是其编程专用模式Claude Code,变得不如以前“聪明”了。这并非主观感受,而是有数据支撑的。AMD AI总监Stella Laurenzo分析了超过6800个真实编程会话的数据,发现Claude的行为模式发生了显著变化:
根本原因:这一切的根源在于Anthropic为平衡服务成本与响应速度,悄然引入了 “自适应思考” 机制,并将默认的思考努力等级从“高”调至“中”。这意味着,模型会根据它对任务复杂度的(可能错误的)判断,动态分配“思考预算”。对于复杂的编程任务,它可能只动用中等程度的“脑力”,结果就是输出质量断崖式下跌。讽刺的是,由于错误增多导致反复重试,用户最终消耗的Token和成本可能反而更高。
Claude降智和偷Token的解决办法分享
面对官方的“优化”,用户可以主动采取以下措施,强制Claude恢复更深的思考,并优化使用习惯以节省开支。
1. 核心配置修改:锁定高性能模式 最直接有效的方法是通过修改本地配置文件,禁用自适应思考并锁定高思考预算。在Claude Code的配置文件~/.claude/settings.json中,可以加入以下设置:
~/.claude/settings.json
{ "effortLevel": "high", "env": { "CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": "1", "MAX_THINKING_TOKENS": "31999", "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1", "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "200000" } }
effortLevel: “high”
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING: “1”
MAX_THINKING_TOKENS
2. 高效使用习惯:精细化管理Token消耗 Token消耗的大头(70%-90%)是输入(Input),尤其是系统自动加载的上下文。优化习惯能立竿见影地省钱:
/clear
/compact
src/auth.ts
login
@文件名
!
git status
ls
!git status
3. 项目级优化:减少无效探索
CLAUDE.md
.claudeignore
.gitignore
node_modules/
dist/
*.log
上述配置和习惯并非纸上谈兵,它们针对的是Claude Code用户在日常开发中遇到的核心痛点:
对于深度用户,还可以借助第三方工具实现更极致的优化:
cargo test
glob
文章来源:本文综合整理自技术社区关于Claude Code“降智”事件的讨论与解决方案,主要参考了AMD AI总监的量化分析报告、开发者总结的配置方案以及多位博主分享的Token节省实践指南。