MemClaw:给 OpenClaw 装上“超级大脑“,Token 成本暴降 91%
用过 OpenClaw 的同学一定深有体会每次对话结束之前聊过的 API 用法、技术决策、项目背景就像被橡皮擦抹掉一样。这不是 OpenClaw 的 Bug而是所有 LLM Agent 的共同困局——上下文窗口有限会话结束即遗忘。项目地址https://github.com/sopaco/cortex-mem社区常见的解法是 OpenViking 这类记忆插件但你有没有想过有没有一种方案既能记住更多还能省下大把 Token 成本答案是肯定的。MemClaw(基于Cortex Memory的OpenClaw记忆插件) 横空出世在官方 LoCoMo 评测中拿下68.42% 的最高分超越 OpenViking 的 52.08%同时 Token 消耗比 OpenClawLanceDB节省 11 倍每千 Token 得分效率提升 18 倍。MemClaw基于OpenClaw插件体系设计只需要在部署有OpenClaw的环境中执行一行命令openclaw plugins install memclaw/memclaw即可安装本插件通过ClawHub官方安全认证 https://clawhub.ai/sopaco/memclaw这不是魔法而是架构的力量。让我们一探究竟。为什么 OpenClaw 需要外挂记忆如果你是 OpenClaw 的重度用户下面这些场景一定不陌生场景一API 配置反复问用户调用阿里云 OSS 上传文件 Agent请问您的 AccessKey 是什么 用户xxx 第二天新会话 用户再帮我上传一个文件 Agent请问您的 AccessKey 是什么 用户内心崩溃昨天不是告诉过你了吗...场景二长对话后失忆用户我的项目目标是构建一个面向 ToB 企业的销售工具 50 轮对话后讨论各种技术细节 用户基于我之前说的目标帮我设计核心架构 Agent您之前说的目标是什么来着场景三重复踩坑用户调用 sales-db-query 技能参数格式错误 Agent报错 用户正确格式是 {...} 新会话 用户再调用一次这个技能 Agent又是同样的错误这些问题的根源在于OpenClaw 原生的记忆系统是金鱼记忆——上下文窗口一满前面的内容就被挤出去了会话一结束所有状态归零。OpenViking 的解法 vs Cortex Memory 的降维打击OpenViking 的出现确实解决了这个问题通过虚拟文件系统 向量检索让 Agent 拥有了长期记忆。但 Cortex Memory 在此基础上做了降维打击评测数据说话系统LoCoMo 评测得分平均 Token/问题每千 Token 得分Cortex Memory68.42%~2,90023.6OpenViking OpenClaw52.08%~2,76918.8OpenClaw LanceDB44.55%~33,4901.3OpenClaw 原生记忆35.65%~15,9822.2关键洞察MemClaw(基于Cortex Memory的OpenClaw插件) 不仅得分最高而且 Token 效率碾压式领先——相比 OpenClawLanceDBToken 节省 91%效率提升 18 倍。为什么 Cortex Memory 能做到秘密在于三层记忆架构传统方案的问题要么全量加载Token 爆炸要么只存摘要丢失细节。Cortex Memory 的解法分层渐进检索——先用 100 Token 的摘要快速过滤再用 2000 Token 的概览精炼最后只加载真正需要的完整内容。结果检索 100 条记忆传统方案需要加载 100 × 完整内容Cortex Memory 只需要 100 × 100 TokenL0 层 少数 L1/L2 层。MemClaw一键给 OpenClaw 升级Cortex Memory 提供了开箱即用的 OpenClaw 插件——MemClaw。安装只需一行命令openclaw pluginsinstallmemclaw/memclaw配置超简单在openclaw.json中添加{plugins:{entries:{memclaw:{enabled:true,config:{llmApiKey:your-api-key,embeddingApiKey:your-api-key}}}},agents:{defaults:{memorySearch:{enabled:false}// 禁用原生记忆}}}核心工具一览工具用途cortex_search分层语义搜索可控制返回哪一层cortex_recall召回带完整上下文的记忆cortex_add_memory存储重要信息供后续检索cortex_commit_session提交会话并触发记忆提取cortex_migrate一键迁移 OpenClaw 原生记忆cortex_maintenance定期维护清理、重建索引实战效果从健忘到过目不忘案例 1技能调用经验沉淀问题调用某个技能总是报参数错误每次新会话都要重新试错。MemClaw 解决方案用户调用 sales-db-query 技能查询全国销售数据 Agent调用成功MemClaw 自动记录正确参数格式 三天后新会话 用户再查一下华东区的数据 AgentMemClaw 检索到之前的成功案例直接使用正确格式案例 2长对话目标不丢失问题50 轮对话后Agent 忘了最初设定的项目目标。MemClaw 解决方案用户我的项目目标是构建 ToB 销售工具重点关注稳定性 100 轮对话后 用户基于我之前的目标设计核心架构 AgentMemClaw 检索到原始目标输出符合约束的方案案例 3跨会话记忆复用问题每次新会话都要重新输入 API 密钥。MemClaw 解决方案会话 A用户输入 OSS 密钥MemClaw 存储到 cortex://user/preferences/ 会话 B用户请求上传文件MemClaw 自动检索到密钥无需重复输入技术亮点为什么选择 Cortex Memory1. Rust 实现性能拉满相比 Node.js 实现的记忆方案Cortex Memory 用 Rust 写成内存安全无 GC 停顿无内存泄漏并发处理Tokio 异步运行时高并发场景表现优异资源占用低同样负载下内存占用降低 60%2. 完全本地化数据隐私所有记忆存储在本地cortex-data/目录向量数据库使用本地 Qdrant或远程零云端依赖适合敏感数据场景3. 多租户隔离支持多个隔离的记忆空间cortex-data/ ├── tenants/ │ ├── project-a/ # 项目 A 的记忆 │ ├── project-b/ # 项目 B 的记忆 │ └── personal/ # 个人记忆4. 丰富的接口CLI 工具cortex-mem命令行管理REST API/api/v2/*端点MCP 协议支持 Claude Desktop、Cursor 等Web DashboardSvelte 5 可视化管理快速上手1. 安装依赖# 安装 Qdrant 向量数据库dockerrun-p6333:6333-p6334:6334 qdrant/qdrant# 安装 MemClaw 插件openclaw pluginsinstallmemclaw/memclaw2. 配置 API 密钥{plugins:{entries:{memclaw:{enabled:true,config:{llmApiBaseUrl:https://api.openai.com/v1,llmApiKey:sk-xxx,llmModel:gpt-5-mini,embeddingApiBaseUrl:https://api.openai.com/v1,embeddingApiKey:sk-xxx,embeddingModel:text-embedding-3-small}}}}}3. 开始使用重启 OpenClaw GatewayMemClaw 会自动启动后台服务。现在你的 Agent 拥有了超级大脑。写在最后Cortex Memory 不是一个简单的记忆存储它是AI Agent 的认知基础设施。它用三层架构解决了记忆精度 vs Token 成本的悖论用 Rust 实现保证了性能和稳定性用 MemClaw 插件实现了与 OpenClaw 的无缝集成。如果你厌倦了 Agent 的金鱼记忆如果你心疼 Token 消耗如果你需要生产级的长期记忆方案——Cortex Memory 值得一试。项目地址https://github.com/sopaco/cortex-memMemClaw 插件examples/memclaw/plugin完整文档litho.docs/zh