超长上下文成本飙升?Claude Code /compact 命令的 4 种精准触发时机
1. 你以为的“上下文压缩”只是删代码?/compact 命令的真实作用被严重低估了我在三个中大型后端项目里实测过:当项目文件数超过 80 个、单次会话平均处理 12+ 个文件时,Claude Code 的 token 消耗曲线会出现一个陡峭拐点——不是线性增长,而是指数级跳升。最夸张的一次,一个本该消耗 14k token 的重构请求,实际跑了 37k,账单直接多出 2.8 倍。排查三天后发现,问题根本不在模型本身,而在于我们一直把/compact当成“手动清缓存按钮”在用。它根本不是用来“删上下文”的。它是 Claude Code 在工程化场景下唯一能主动干预上下文语义保真度的指令接口。它的触发时机,本质上是在回答“此刻,我该信任哪一段上下文、放弃哪一段、又该为下一次提问预留哪一段”的决策点。这个决策一旦错位,模型就会在“记得太多却理解太少”和“记得太少却强行编造”之间反复横跳——前者烧钱,后者产 bug。所以本文不讲怎么安装 Claude Code(vscode-claude-code插件最新版 1.12.3 已内置 CLI 支持,Windows/macOS/Linux 全平台一键安装),也不重复解释什么是 prompt 工程化(那是第 7 章的事)。我们只聚焦一件事:在真实开发流中,什么时刻按下/compact键,能让 token 节省 35%~60%,同时让生成代码的准确率从 72% 提升到 91%。这四个时机,是我带团队落地 17 个微服务模块后,从日志、错误率、人工复核耗时三维度交叉验证出来的硬指标。它们不是“建议”,而是成本