摘要:DeepSeek V4 Pro官宣永久2.5折优惠,缓存命中输入仅0.025元/百万token,未命中输入3元,输出6元——这价格直接把Claude Sonnet 4.6和Gemini 3.5 Flash干到1/20和1/31。降价不是重点,重点是DeepSeek已经嵌入大部分主流agent工具。本文分享我如何把DeepSeek塞进Claude Code、OpenCode、Hermes、pi-goal、Warp等工具,搭建一套“主力判断+长程执行+多通道自主+超长程目标+终端统一”的五层工作流,每层说清为什么接、怎么接、省在哪。
这波降价是真的狠。DeepSeek V4 Pro的打折从限时变成永久,缓存命中输入0.025元/百万token,未命中3元,输出6元。什么概念?一次带完整工具调用的长程编码任务,成本大约是Claude Sonnet 4.6的1/20,Gemini 3.5 Flash的1/31。对比一下,GPT-5.5缓存命中价格是DeepSeek V4 Pro的136倍——这价格屠夫当得名副其实。
但真正让我兴奋的不是价格本身,而是DeepSeek已经进了大部分主力agent工具的接入列表。你现在可以把它嵌进工作流的不同层,让每个模型干它最擅长的事,而不是把所有任务堆在一个工具里。
脱离场景谈模型都是耍流氓。重构老旧项目架构和批量改30个文件,对harness的要求完全不同。前者需要稳定的判断和低错误率,后者需要高context利用率和低成本。我的分法是:
下面一个个讲配置和心法。
Claude Code原生接DeepSeek很简单——环境变量一配就行。适合用它跑token消耗大、但对判断质量要求没那么极致的任务(写文档、单元测试、部署脚本、迁移重构)。日常项目80%的场景DeepSeek都够用,没必要每把都用最贵的模型。
配置如下,写入 .zshrc 或 .bashrc:
.zshrc
.bashrc
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_AUTH_TOKEN=<你的 DeepSeek API Key> export ANTHROPIC_MODEL=deepseek-v4-pro[1m] export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m] export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m] export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash export CLAUDE_CODE_EFFORT_LEVEL=max
这个配置让主模型和强推理走V4 Pro(1M上下文),subagent和轻量调用走V4 Flash,既保证能力又压成本。
一个提醒:别用CC Switch这类桌面配置工具,容易污染系统环境变量。我远程帮几个朋友调问题时发现他们环境被第三方工具改得乱七八糟。直接在当前会话export就好,用完就清,干净可控。
Claude Code是高级架构师,OpenCode+DeepSeek就是耐造的执行工程师。OpenCode开箱即用,不用写一堆规则和插件,到手就是一个搭好的低成本工程执行环境。
接入步骤:
opencode
/connect
deepseek
DeepSeek-V4-Pro
四步搞定,不用改配置文件。我的习惯是用Shift+Tab切到Plan Executor模式,让agent先说明要做什么,确认后再动手。面对混乱命名、跨文件依赖的老项目,先规划再执行能提前发现逻辑漏洞。
Shift+Tab
OpenCode和Claude Code都是编码工具,没有跨会话记忆和通道接入的概念。Hermes补的就是这块——能记住上下文、接飞书消息、自己学新技能。DeepSeek在这里负责推理,Hermes负责框架调度。
安装:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
然后执行hermes model,交互式向导选deepseek、填Key、选模型。目前我只用V4 Flash,便宜又够快,跟Hermes是天然搭子。
hermes model
Claude Code和OpenCode的单次任务有context上限和轮次限制,跑不了真正几十步的目标。pi-goal专为此设计,它的prompt cache工作模式和DeepSeek的缓存机制绝配——实测一次完整任务cache hit rate能到97%以上,只有不到3%按正价计费。DeepSeek缓存命中输入才0.025元/百万token,几乎等于免费。
配置 ~/.pi/agent/models.json:
~/.pi/agent/models.json
{ "providers": { "deepseek": { "baseUrl": "https://api.deepseek.com", "api": "openai-completions", "apiKey": "DEEPSEEK_API_KEY", "models": [ { "id": "deepseek-chat", "name": "DeepSeek V3", "contextWindow": 64000 }, { "id": "deepseek-reasoner", "name": "DeepSeek R1", "contextWindow": 64000, "reasoning": true } ] } } }
使用:/goal --tokens 200k 你的目标描述,写到能逐项checklist的颗粒度,pi-goal就会分解执行。
/goal --tokens 200k 你的目标描述
Warp正式版开通自定义接口,10人以内团队免费。接入DeepSeek后,相当于白嫖一个顶级命令行Agent,省了每月20刀的Warp订阅。
配置:Settings → AI → Custom inference endpoint
https://api.deepseek.com/v1
deepseek-v4-pro
保存后所有Warp Agent请求都走DeepSeek。Warp还是Claude Code、OpenCode、Codex这些CLI agent的良好宿主——侧边栏快速切换、Rich Input Editor发多行prompt和文件路径,比普通终端顺手很多。
DeepSeek这波降价后,我充了100多块钱,一个月下来花了140元左右。对比那些动不动200元一个月的Coding Plan订阅,简直白菜价。而且DeepSeek V4-Pro的综合能力已经接近GPT-4o,跟GPT-5.5差距也不大——拿这个价格跑这种级别的模型,以前想都不敢想。
当然DeepSeek目前唯一的短板是缺内置多模态功能,如果补上,真的无敌。但纯文本编程场景,它已经绰绰有余。
如果你做市场调研或学术研究,还可以搭配Kimi做信息检索和长文本处理,让DeepSeek专注逻辑分析。另外,阿里云百炼等第三方平台也提供了DeepSeek的免费调用额度,适合刚上手测试。不过要是追求极致性价比和完整工具链,还是官方API直连最香。
本文首发于大国Ai导航(daguoai.com),关注我们获取更多AI工具深度评测与实战技巧。