Hermes Agent 进阶:8 个让 AI 从“聊天”走向“自动化”的实战技巧
很多人装了 Hermes 一周后觉得“跟 ChatGPT 差不多”——问一句答一句用完就关。其实你只用了它 10% 的能力。本文不讲安装不讲基础对话直接分享 8 个进阶玩法让 Agent 真正替你干活。一、SOUL.md给 Agent 注入“人设”Hermes 启动时会自动读取SOUL.md文件作为系统人格注入每次对话。默认的 SOUL 是一个礼貌但无趣的通用助手改掉它Agent 就能变成你想要的样子。高效改写技巧删掉所有“取决于情况”之类的和稀泥表述去掉客服腔“好问题”“我很乐意帮您”强制要求“直接回答不铺垫”加入具体的行为约束比如“不要用感叹号”“可以指出我的错误”示例片段markdown你有明确的观点。 禁止说“视情况而定”。 不要以“好问题”或“很高兴为你服务”开头。 回答要简洁。 做那种凌晨两点你还愿意聊的助手不是客服机器人。建议SOUL.md保持在 1KB 以内只写你反复需要纠正的行为规则比泛泛的性格描述有效得多。二、三层记忆系统让 Agent 真正“记住”你Hermes 的记忆分为三层这是它和普通 AI 助手的核心差异层级作用生命周期Session Memory当前对话的上下文会话结束即清空Persistent Memory长期事实与偏好MEMORY.md/USER.md跨会话持久Skill Memory从经验中提炼的可复用工作流持久保存关键操作每次完成复杂任务后告诉 Hermes “把这次的关键经验存下来”它会自动将踩过的坑、验证过的方法写入MEMORY.md。定期让 Agent 在心跳周期里做 Memory 维护读取最近几天的日志文件提炼有价值经验更新到长期记忆。相当于 AI 自己“复盘”。三、AGENTS.md项目级的“工作手册”如果你同时维护多个项目AGENTS.md是必备机制。在每个项目的根目录下放置该文件Hermes 在该目录下工作时会自动读取。示例内容markdown这是 FastAPI 后端使用 SQLAlchemy ORM。 所有数据库操作必须用 async/await。 测试放在 tests/ 目录使用 pytest-asyncio。 严禁提交 .env 文件。根目录的AGENTS.md在会话启动时加载子目录的文件是惰性发现的。同时Hermes 也能识别.cursorrules和.cursor/rules/*.mdc如果你之前用过 Cursor 的规则可以直接复用。四、Cron 定时任务让 Agent 在你休息时工作Hermes 内置了自然语言定时任务系统。创建任务几乎不需要记忆 cron 表达式text/cron add every morning at 9am Check Hacker News for AI news and send me a summary进阶用法Cron 任务可以挂载 Skill。例如挂上blogwatcher技能它就知道如何检查 RSS、筛选内容、生成摘要。多个 Skill 可同时挂在一个任务上text/cron add every 6h Look for new local events --skill blogwatcher --skill find-nearbySILENT 模式如果监控类任务一切正常可以在指令中加入“如果正常则回复 [SILENT]”这样只有异常时才通知你非常适合告警场景。五、Skill 系统Agent 的“肌肉记忆”Skill 不是简单的“插件”真正的价值在于多个 Skill 组合后产生的自动化流水线。实战案例5 个 Skill 打造 Twitter 自动化采集抓取目标账号的 30 条推文输出人格画像信息偏好、写作风格检索根据画像中的话题自动搜索最近 12 小时的新闻素材创作结合画像与素材生成多条推文并用打分机制筛选配图为通过筛选的推文生成统一视觉的配图发布批量发布支持原创、引用、回复并分散到早 9、午 12、晚 8 三个时段整条流水线每天早晨自动运行实测分散发布的互动率比集中发布高出约 40%。Skill 设计原则单一职责每个 Skill 只做一件事文件系统传递Skill 之间通过文件交换数据不依赖内存变量最透明、最易调试幂等性相同输入重复运行不产生副作用可观测每一步都有详细日志和输出文件容错设计单步失败不影响其他步骤当你重复某个操作多次后可以主动说“把刚才做的事情保存为一个 Skill”Hermes 会自动生成可复用的工作流定义存放在~/.hermes/skills/目录下。六、Subagent 委派并行处理多个任务delegate_task工具可以从当前会话派生出独立的子 Agent实现任务并行。例如你需要同时审查一个 PR、搜索竞品数据、整理文档。传统方式串行执行需要 30 分钟使用三个子 Agent 并行10 分钟即可完成。调用示例pythondelegate_task( tasks[ {goal: 审查 PR #123 的代码质量, toolsets: [terminal, file]}, {goal: 搜索竞品 X 最近的融资动态, toolsets: [web]}, {goal: 整理 /docs 目录的文档结构, toolsets: [file]}, ] )子 Agent 只拿到目标任务和必要的工具集没有主会话的冗余历史因此更专注、更快。你还可以为不同子 Agent 指定不同模型简单任务用小模型复杂推理用大模型。七、Prompt Cache降低 API 成本的隐藏技巧Hermes 底层支持 Prompt Caching。在同一个会话中保持系统提示词稳定不频繁切换模型、不随意修改上下文文件后续消息会自动命中缓存大幅降低 API 调用成本。优化建议不要频繁切换模型切换会清缓存避免每次对话都修改AGENTS.md或SOUL.md使用/compress压缩过长的会话历史既省 token 又保持缓存命中率使用/usage监控消耗找到自己的最佳节奏在每天 100~200 条消息的活跃助手场景下合理利用缓存可将月成本控制在 $20–50 之间取决于所选模型。八、多平台网关手机随时指挥 AgentHermes 有一个 Gateway 守护进程可同时连接 Telegram、Discord、Slack、WhatsApp、Signal 等多个平台。配置完成后你可以在手机上直接向 Agent 发消息它会执行任务并返回结果。Cron 任务的输出也会直接推送到你指定的平台。实用细节使用/sethome命令设置一个 Home Channel 后所有主动通知、Cron 结果、定期报告都会发送到该频道不会散落在各个对话中。迁移提示从 OpenClaw 过来怎么办如果你之前使用 OpenClawHermes 提供了一键迁移命令bashhermes claw migrate --dry-run # 预览迁移内容 hermes claw migrate # 正式迁移它会自动迁移SOUL.md、MEMORY.md、Skill、模型配置等 30 多类数据。注意会话历史和 Cron 任务定义不会迁移需要手动重建。附LightRAG – 当朴素 RAG 不够用时Hermes 默认使用向量检索朴素 RAG适合大多数场景。如果你有大量文档需要深度理解例如几百篇论文、整个代码库可以接入 LightRAG。它不光是切向量还会提取实体和关系构建知识图谱。检索时不是找“相似的文本块”而是找“关联的知识”。你问“X 和 Y 有什么关系”它能给出图谱级别的回答而非一堆拼凑的段落。该功能需额外安装适合研究者、分析师、文献综述等重度知识管理用户。最后一点认知Hermes 不是一个孤立的工具而是一个会随着你使用而持续成长的系统。你踩过的坑变成 Skill你的偏好写入 Memory项目规则刻在 AGENTS.md 里。三个月后它不只是 AI 助手更像是另一个你——在你不在的时候继续替你工作。从你最痛的点切入重复指令多先优化 SOUL.md。多项目切换乱先写 AGENTS.md。需要定时任务直接上 Cron。开始用然后让系统自己长大。本文经验基于 Hermes Agent 官方文档、社区实践及用户实测整理。