Claude Code 切换模型时，为什么一次 /model 会让缓存重新变冷

张

张建站

2026/7/2 19:01:07

10分钟阅读

我今天正在整理 Claude Code 的 prompt caching 机制时，发现一个很容易被低估的细节，很多时候 Claude Code 变慢，并不是模型突然退化，也不是网络抖了一下，而是我们在会话中间做了一次模型切换。终端里看起来只是敲了一个/model，背后却等于让 Claude Code 带着整段上下文，去另一个模型那里重新排队、重新读取、重新建立缓存。Anthropic 的 Claude Code 文档把这件事讲得很直接，Claude Code 每次发送消息都会发起新的 API request，模型本身不会在两次 request 之间保留记忆，所以 Claude Code 会把 system prompt、项目上下文、历史消息、工具结果和新消息一起重新发送。prompt caching 的价值就在这里，它会复用前面已经处理过的 prompt prefix，只处理新增部分。这个 prefix 匹配是精确匹配，前面的内容一旦变了，后面的部分就要重新计算。说到模型切换，最容易踩坑的点在于，cache 不只是和文本内容有关，也和 model 绑定在一起。Anthropic 文档明确说明，每个 model 都有自己的 cache，用/model切换模型以后，即使会话内容完全相同，下一次 request 也会读取完整 conversation history，并且没有 cache hit。这和很多开发者对缓存的直觉不太一样。我们平时做后端，想到 cache key，可能会想到 URL、参数、用户 ID、tenant、locale、权限范围。到了 Claude Code 这里，model 本身也是 cache key 的核心组成部分。Sonnet 处理过的一

如何用5个STM32实战项目快速掌握嵌入式开发：从零到精通的完整指南

如何用5个STM32实战项目快速掌握嵌入式开发：从零到精通的完整指南【免费下载链接】STM32 项目地址: https://gitcode.com/gh_mirrors/stm322/STM32 嘿，朋友！你是不是也对STM32嵌入式开发感到好奇，但又不知道从何入手&…...

2026/7/2 19:00:20 阅读更多 →

深岩银河存档编辑器：轻松调整游戏资源，告别重复刷矿的烦恼

深岩银河存档编辑器：轻松调整游戏资源，告别重复刷矿的烦恼【免费下载链接】DRG-Save-Editor Rock and stone! 项目地址: https://gitcode.com/gh_mirrors/dr/DRG-Save-Editor 还在为《深岩银河》中稀有的Enor Pearl矿物而烦恼吗？是否…...

2026/7/2 18:59:00 阅读更多 →

可信AI智能体开发：技术要点与实战指南

1. 赛事背景与核心价值2026年Nova AI挑战赛由全球顶尖科技企业发起，聚焦可信软件智能体这一前沿技术领域。这项赛事本质上是对下一代智能系统开发者的集中考验——如何构建既强大又可靠的AI助手。作为从业者，我深刻理解当前AI应用落地的最大瓶颈不是技术…...

2026/7/2 18:53:16 阅读更多 →

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料资料全科都有英语四六级备考资料 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Comprehension" most probably means（ ） A. 理解 B. 表达 C. 翻译 D. 写作答案&#…...

2026/7/1 12:39:34 阅读更多 →

2026年英语四级|2026年大学四级英语备考资料|2026四级备考

2026年英语四级|2026年大学四级英语备考资料|2026四级备考资料全科都有2026四级备考 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Vocabulary" most probably means（ ） A. 词汇 B. 语法 C. 阅读 D. 听力答案：A 解析&…...

2026/7/2 16:29:59 阅读更多 →