MemClaw：给 OpenClaw 装上“超级大脑“，Token 成本暴降 91%

张

张建站

2026/6/10 4:51:31

10分钟阅读

MemClaw：给 OpenClaw 装上“超级大脑“，Token 成本暴降 91%

用过 OpenClaw 的同学一定深有体会每次对话结束之前聊过的 API 用法、技术决策、项目背景就像被橡皮擦抹掉一样。这不是 OpenClaw 的 Bug而是所有 LLM Agent 的共同困局——上下文窗口有限会话结束即遗忘。项目地址https://github.com/sopaco/cortex-mem社区常见的解法是 OpenViking 这类记忆插件但你有没有想过有没有一种方案既能记住更多还能省下大把 Token 成本答案是肯定的。MemClaw(基于Cortex Memory的OpenClaw记忆插件) 横空出世在官方 LoCoMo 评测中拿下68.42% 的最高分超越 OpenViking 的 52.08%同时 Token 消耗比 OpenClawLanceDB节省 11 倍每千 Token 得分效率提升 18 倍。MemClaw基于OpenClaw插件体系设计只需要在部署有OpenClaw的环境中执行一行命令openclaw plugins install memclaw/memclaw即可安装本插件通过ClawHub官方安全认证 https://clawhub.ai/sopaco/memclaw这不是魔法而是架构的力量。让我们一探究竟。为什么 OpenClaw 需要外挂记忆如果你是 OpenClaw 的重度用户下面这些场景一定不陌生场景一API 配置反复问用户调用阿里云 OSS 上传文件 Agent请问您的 AccessKey 是什么用户xxx 第二天新会话用户再帮我上传一个文件 Agent请问您的 AccessKey 是什么用户内心崩溃昨天不是告诉过你了吗...场景二长对话后失忆用户我的项目目标是构建一个面向 ToB 企业的销售工具 50 轮对话后讨论各种技术细节用户基于我之前说的目标帮我设计核心架构 Agent您之前说的目标是什么来着场景三重复踩坑用户调用 sales-db-query 技能参数格式错误 Agent报错用户正确格式是 {...} 新会话用户再调用一次这个技能 Agent又是同样的错误这些问题的根源在于OpenClaw 原生的记忆系统是金鱼记忆——上下文窗口一满前面的内容就被挤出去了会话一结束所有状态归零。OpenViking 的解法 vs Cortex Memory 的降维打击OpenViking 的出现确实解决了这个问题通过虚拟文件系统向量检索让 Agent 拥有了长期记忆。但 Cortex Memory 在此基础上做了降维打击评测数据说话系统LoCoMo 评测得分平均 Token/问题每千 Token 得分Cortex Memory68.42%~2,90023.6OpenViking OpenClaw52.08%~2,76918.8OpenClaw LanceDB44.55%~33,4901.3OpenClaw 原生记忆35.65%~15,9822.2关键洞察MemClaw(基于Cortex Memory的OpenClaw插件) 不仅得分最高而且 Token 效率碾压式领先——相比 OpenClawLanceDBToken 节省 91%效率提升 18 倍。为什么 Cortex Memory 能做到秘密在于三层记忆架构传统方案的问题要么全量加载Token 爆炸要么只存摘要丢失细节。Cortex Memory 的解法分层渐进检索——先用 100 Token 的摘要快速过滤再用 2000 Token 的概览精炼最后只加载真正需要的完整内容。结果检索 100 条记忆传统方案需要加载 100 × 完整内容Cortex Memory 只需要 100 × 100 TokenL0 层少数 L1/L2 层。MemClaw一键给 OpenClaw 升级Cortex Memory 提供了开箱即用的 OpenClaw 插件——MemClaw。安装只需一行命令openclaw pluginsinstallmemclaw/memclaw配置超简单在openclaw.json中添加{plugins:{entries:{memclaw:{enabled:true,config:{llmApiKey:your-api-key,embeddingApiKey:your-api-key}}}},agents:{defaults:{memorySearch:{enabled:false}// 禁用原生记忆}}}核心工具一览工具用途cortex_search分层语义搜索可控制返回哪一层cortex_recall召回带完整上下文的记忆cortex_add_memory存储重要信息供后续检索cortex_commit_session提交会话并触发记忆提取cortex_migrate一键迁移 OpenClaw 原生记忆cortex_maintenance定期维护清理、重建索引实战效果从健忘到过目不忘案例 1技能调用经验沉淀问题调用某个技能总是报参数错误每次新会话都要重新试错。MemClaw 解决方案用户调用 sales-db-query 技能查询全国销售数据 Agent调用成功MemClaw 自动记录正确参数格式三天后新会话用户再查一下华东区的数据 AgentMemClaw 检索到之前的成功案例直接使用正确格式案例 2长对话目标不丢失问题50 轮对话后Agent 忘了最初设定的项目目标。MemClaw 解决方案用户我的项目目标是构建 ToB 销售工具重点关注稳定性 100 轮对话后用户基于我之前的目标设计核心架构 AgentMemClaw 检索到原始目标输出符合约束的方案案例 3跨会话记忆复用问题每次新会话都要重新输入 API 密钥。MemClaw 解决方案会话 A用户输入 OSS 密钥MemClaw 存储到 cortex://user/preferences/ 会话 B用户请求上传文件MemClaw 自动检索到密钥无需重复输入技术亮点为什么选择 Cortex Memory1. Rust 实现性能拉满相比 Node.js 实现的记忆方案Cortex Memory 用 Rust 写成内存安全无 GC 停顿无内存泄漏并发处理Tokio 异步运行时高并发场景表现优异资源占用低同样负载下内存占用降低 60%2. 完全本地化数据隐私所有记忆存储在本地cortex-data/目录向量数据库使用本地 Qdrant或远程零云端依赖适合敏感数据场景3. 多租户隔离支持多个隔离的记忆空间cortex-data/ ├── tenants/ │ ├── project-a/ # 项目 A 的记忆 │ ├── project-b/ # 项目 B 的记忆 │ └── personal/ # 个人记忆4. 丰富的接口CLI 工具cortex-mem命令行管理REST API/api/v2/*端点MCP 协议支持 Claude Desktop、Cursor 等Web DashboardSvelte 5 可视化管理快速上手1. 安装依赖# 安装 Qdrant 向量数据库dockerrun-p6333:6333-p6334:6334 qdrant/qdrant# 安装 MemClaw 插件openclaw pluginsinstallmemclaw/memclaw2. 配置 API 密钥{plugins:{entries:{memclaw:{enabled:true,config:{llmApiBaseUrl:https://api.openai.com/v1,llmApiKey:sk-xxx,llmModel:gpt-5-mini,embeddingApiBaseUrl:https://api.openai.com/v1,embeddingApiKey:sk-xxx,embeddingModel:text-embedding-3-small}}}}}3. 开始使用重启 OpenClaw GatewayMemClaw 会自动启动后台服务。现在你的 Agent 拥有了超级大脑。写在最后Cortex Memory 不是一个简单的记忆存储它是AI Agent 的认知基础设施。它用三层架构解决了记忆精度 vs Token 成本的悖论用 Rust 实现保证了性能和稳定性用 MemClaw 插件实现了与 OpenClaw 的无缝集成。如果你厌倦了 Agent 的金鱼记忆如果你心疼 Token 消耗如果你需要生产级的长期记忆方案——Cortex Memory 值得一试。项目地址https://github.com/sopaco/cortex-memMemClaw 插件examples/memclaw/plugin完整文档litho.docs/zh

从零开始：在VMware上配置OpenEuler-24.03-LTS-SP1静态IP的完整流程

从零构建企业级OpenEuler服务器：VMware静态IP配置实战指南在企业级Linux服务器部署中，静态IP配置是确保服务稳定性的基石。作为国产操作系统的代表，OpenEuler 24.03 LTS SP1以其高性能和安全性正获得越来越多技术团队的青睐。本文将手把手带…...

2026/6/10 5:17:46 阅读更多 →

墨语灵犀生成惊艳技术文档：API手册与项目说明效果对比

墨语灵犀生成惊艳技术文档：API手册与项目说明效果对比每次接手一个新项目，或者要对外提供一个接口，最头疼的事情之一就是写文档。API接口怎么描述？参数有哪些？返回什么数据？项目怎么快速上手？…...

2026/6/10 5:14:35 阅读更多 →

专家公开未修复的Windows 0Day漏洞BlueHammer

研究人员公开未修复的Windows 0Day漏洞"BlueHammer"，攻击者可获取SYSTEM权限；目前尚无补丁据Bleeping Computer报道，一名心怀不满的研究人员公开了Windows 0Day漏洞BlueHammer，该权限提升漏洞允许攻击者获取SYSTEM或管…...

2026/6/9 16:26:41 阅读更多 →

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…...

2026/6/10 4:21:44 阅读更多 →

2026实测盘点｜适合国内高校生的AI写作平台，降重润色哪家强？

2026年毕业季，学术审查全面加码。教育部明确要求毕业论文AIGC率不得超过30%，985/211院校更是将红线压到了20%以内，硕士论文甚至卡到15%。与此同时，知网上线AIGC 3.0系统，可实现段落级内容溯源；维普引入语义…...

2026/6/10 19:45:23 阅读更多 →

JewelCraft：Blender珠宝设计的终极免费解决方案

JewelCraft：Blender珠宝设计的终极免费解决方案【免费下载链接】jewelcraft Blender add-on for jewelry design 项目地址: https://gitcode.com/gh_mirrors/je/jewelcraft JewelCraft是一款专为珠宝设计师和3D艺术家打造的Blender插件，提供完整…...

2026/6/10 4:21:44 阅读更多 →