写了这么多单点文章——OpenClaw 搜索、Hermes Curator、Hindsight 记忆分析、Agent Mail——但一直没把整个架构串起来。今天画张图,讲讲这几个东西到底怎么分工、怎么配合的。
先看整体
核心思路就一句话:Hermes 当大脑,OpenClaw 当手脚,Hindsight 当共享记忆。
为什么要拆成两个 Agent
二月开始用 OpenClaw,一个人干了所有事。聊天、写代码、搜资料、写博客、跑定时任务,全靠它。
问题在哪?它像一个万能实习生——什么都能干,但什么都干不深。代码写一半切去回微信,回来忘了上下文。定时任务跑着跑着断了,发现是配置文件冲突。(之前对比过)
四月上了 Hermes。试了一周后决定:让专业的干专业的事。
分工逻辑很简单——看需求特征:
| 需求特征 | 适合谁 | 为什么 |
|---|---|---|
| 需要深度上下文延续 | Hermes | 跨会话记忆更强,/steer中途修正(新版本OpenClaw也引入了steer) |
| 多平台来回切 | OpenClaw | 微信/飞书/WebUI 原生覆盖 |
| 写代码、审代码 | Hermes | 内置技能生成,写完自动总结成技能 |
| 查资料、写文章 | OpenClaw | 搜索结果直接塞上下文 |
| 定时任务 | Hermes | Cron 稳,审批不碍事 |
| 收邮件、注册账号 | Agent Mail | 独立身份,不乱碰你个人邮箱 |
不是哪个更好,是场景不同。
记忆怎么共享的
这是最关键的问题。两个 Agent 各干各的,但不能各记各的——你在微信上跟 OpenClaw 提了个偏好,Hermes 也得知道。
Hindsight 跑在独立 PostgreSQL 上,两个 Agent 各开一个 bank(openclaw 和 hermes),通过 API 存取记忆。
你在微信说了一句「IPC 协议传在线人数,别用 Redis」
│
▼
OpenClaw 收到 → Hindsight auto-retain 记入 openclaw bank
│
▼
第二天你让 Hermes 写个在线人数统计
│
▼
Hermes auto-recall → 从 hermes bank 捞出相关记忆
(如果两个 bank 共享/合并,也能捞到 openclaw bank 的记录)
目前两个 bank 是分开的。加起来快 5000 条记忆(OpenClaw 1200+、Hermes 3700+),各自独立。但 Hindsight 支持动态 bank,配成同一个 bank_id 就共享了。
现状是:两个银行分别记,Hermes 那边记得更多(因为日常主力)。OpenClaw 的 bank 偏辅助,主要是博客风格、公众号操作、文件管理这类。
Hindsight 和 MEMORY.md 的关系:
- MEMORY.md → 人工确认过的持久偏好,不会自动改
- Hindsight → 自动从对话里抓,追加型,会慢慢累积
- 两者互补。MEMORY.md 是宪法,Hindsight 是会议纪要
技能体系
Hermes 的 Curator(写过一篇详细分析)每周自动扫一遍技能目录,归档过期技能、合并重复技能、更新交叉引用。
72 个技能 → 跑完剩 53 个,净减 19 个。合并逻辑挺合理——比如 4 个分散的 himalaya 相关技能合并成 1 个主技能加 3 个 reference。
OpenClaw 这边,52,000+ 社区技能(ClawHub),但实际常用的就那几个。两边技能体系不互通——Hermes 的技能是它自己生成的,OpenClaw 的技能是社区下载的。各有各的生态。
模型怎么走
两个 Agent 都走 New-API(自建的模型网关),统一管理 Key、限流、成本统计。
OpenClaw ──► New-API ──► DeepSeek V4 系列
Hermes ──► New-API ──► DeepSeek V4 系列 + GLM-5.x + minimax系列
Hindsight 也走 New-API,用 bge-m3 做 embedding、bge-reranker-v2-m3 做重排序、deepseek-v4-flash 做 LLM。
所有 API 调用在 New-API 后台一目了然,不用去各平台查账单。
搜索方案
主力 Tavily(AI 优化过的搜索结果,每月 1000 次免费),备用 SearXNG(自建,免费无限制)。(详细横评写过)
邮件:Agent 的独立身份
用了 QQ 邮箱的 Agently Mail(对比过和普通邮箱的区别),两个 Agent 各一个地址。
场景就一个:Agent 需要注册 GitHub / SaaS 工具 / 论坛账号时,用自己的邮箱,不用绑我的实名。独立的数字身份,出事了可追溯。
定时任务
7 个 cron 全跑在 Hermes 上:
- A 股每日复盘
- 每日简报
- 周总结
- 备份(三层策略)
- 缓存清理
- 邮件清理
- Himalaya 邮件检查
选 Hermes 不选 OpenClaw 跑 cron,纯粹因为 Hermes 的 cron 更稳——OpenClaw 五月那波更新导致记忆停摆六周,虽然 cron 还能跑,但不放心。
说说我的用法
日常打开飞书/微信,消息先进 OpenClaw。简单的事 OpenClaw 直接处理(查天气、搜资料、写篇短文),复杂的丢给 Hermes(改代码、审项目、跑长链路任务)。
Hermes / OpenClaw 的 /steer 是杀手功能。任务跑一半发现方向偏了,不用停,直接修正继续。
Curator 每周自动跑一次,19 分钟、87 次 API 调用、一两毛钱。技能库不腐烂就行。
Hindsight 在后台默默记,不打扰。偶尔翻翻记忆库看看记了什么,清理下明显重复的条目。
成本
不算模型本身的 token 消耗(这个是主力开销),基础设施月成本:
| 项目 | 月成本 |
|---|---|
| Hindsight (PostgreSQL + Docker) | 0(自建) |
| SearXNG | 0(自建) |
| Tavily | 0(1000 次/月免费额度内) |
| New-API | 0(自建) |
| Agent Mail | 0(内测免费) |
| 合计 | 0 元 |
唯一花钱的是模型 token,走 DeepSeek V4 系列。具体多少不说了,反正不少。
总结
说简单点就是:
- Hermes = 主力大脑,写代码、跑任务、攒技能
- OpenClaw = 多面手,聊天、查资料、写文章、多平台分发
- Hindsight = 两个 Agent 共享的记忆库,不用每次重复交代
- Curator = Hermes 的自动保洁,技能库不腐烂
- Agent Mail = Agent 的独立身份证
- New-API = 统一管模型、看账单
搭起来不复杂,用起来顺畅。唯一要操心的就是 Hindsight 偶尔手动清理下重复记忆,其他都在自动跑。
如果你也在用多个 AI Agent,希望这个架构能帮你理清思路。
评论区