前言: AI 及其应用生态正处于超高速迭代期,半月甚至周级的版本更新已成常态。
效期: 本文内容基于 2026 年 4 月下旬 的实测得出。
环境: 所有测试均在 gpt-oss:120b 本地部署模型下完成,旨在横向对比框架本身的逻辑设计与工具集成质量,LLM 质量不在考察范围内。


一、 服务架构与运维设计

两者的核心差异在于设计重心的分化

  • OpenClaw(网关重心): 采用“中枢式”设计。网关接管一切长期运行的资源(会话、LLM 路由、多用户管理)。其 Skill(技能)与记忆层高度依赖外部插件或手动干预,适合作为“AI 基础设施”进行统一调度。
  • Hermes(Agent 重心): 侧重“个体进化”。Agent 内部集成了更复杂的改进循环。网关更多承担接入层功能,而 Skill 的调度与记忆的剪枝更倾向于由 Agent 自主完成。

1.1 网关与 UI 体验

OpenClaw
OpenClaw 网关截图
提供开箱即用的 WebUI,但在工程实践中,深度配置仍高度依赖 CLI 或直接修改配置文件。UI 层的逻辑兼容性尚不完善,且汉化质量粗糙,更适合习惯“配置驱动”的开发者。

Hermes
Hermes-web-ui 截图
原生 UI 较为简陋。目前主流方案是配合 Hermes-web-ui 项目使用,涵盖了基础的配置与对话管理。但在处理复杂逻辑时,依然无法完全脱离后端配置。


1.2 执行沙箱 (Sandbox)

两者均支持多后端驱动,决定了 Agent 指令执行的安全性与灵活性。

Hermes-Terminal-backend 配置

  1. Docker 模式
    • 特性: 强隔离、高安全性,支持会话级的环境彻底抹除。
    • 痛点: 资源开销大,启动存在秒级延迟。若涉及 GPU 任务(如本地视觉解析),Docker 穿透配置成本较高。
    • 建议: 生产环境下运行未经审核的第三方脚本的首选方案。
  2. SSH 模式
    • 特性: 将指令投递至远程或特定环境运行。
    • 适用: 需要在特定物理机或已有工作流中嵌入 Agent 能力的场景。
  3. Local 模式
    • 警告: 无隔离直接操作宿主机。虽为 Hermes 默认值(追求响应速度),但在非隔离环境(如 WSL 外)建议谨慎开启。

1.3 安全审计与成本监控

  • 安全防御: 二者均具备指令/用户白名单机制。Hermes 的优势在于引入了 LLM 审计模式,即通过消耗少量额外的 Token,利用轻量级模型预判指令风险,实现“低风险自动放行、高风险人工拦截”的平衡。
  • Token 追踪:
    Token 与费用跟踪
    均支持多模型费用看板。OpenClaw 的可观测性更佳,提供更细粒度的流量统计与任务分布图表。

二、 核心功能特性与实测体验

2.1 浏览器自动化 (Browser Automation)

目前的通用方案是将页面内容结构化(类似 MCP 协议),使 Agent 具备“读网”能力。但实测证明,这种“纯文本驱动”的方式仍存在技术瓶颈

  • 视觉盲区: 无法理解图像、复杂的 CSS 排版信息。
  • 交互失效: 难以处理由 JS 监听的动态加载内容(如滚动触发、悬停渲染)。
  • 定位偏差: 缺乏精确坐标映射,导致 Agent 在复杂表单中频繁误触。

实测:OpenClaw

120b 模型下,面对点赞、评论等交互任务:

  1. agent-browser 工具: 使用无头浏览器。虽能读取 DOM,但在多轮对话引导下,依然无法精准定位点赞按钮,存在严重的“元素定位漂移”。
  2. 内置 browser 工具: 配置链路极长,且与 Agent 内部逻辑存在明显的 Schema 不匹配。实测过程中频繁报 Timeout 错误,工程化成熟度较低。

无法完成点赞任务

实测:Hermes

  1. 内置 browser 工具: 易用性完胜。在 WSL 下配合 Chrome 可直接弹出宿主机窗口,实现 “可见即可得” 的操作。
  2. 局限性: Snapshot 工具虽然能抓取全量 DOM,但由于缺乏“滚动-校验-点击”的原子级状态机闭环,Agent 容易产生“我能看见所有元素”的幻觉,尝试点击视窗外的元素导致任务失败。

自动操作示意图


2.2 自我认知与持久记忆

OpenClaw:开放但松散
OpenClaw 人格文件举例
虽支持 SOUL.md 等设定文件,但缺乏原生的“进化闭环”。若无 self-evolve 等外部技能干预,Agent 难以自主迭代性格。实测中发现,Agent 偶尔会发生认知混淆,例如将本应属于“设定”的内容误写入“业务记忆”文件。

Hermes:管控下的闭环
Hermes 中的自我认知处理
设计更严谨。soul 等核心配置文件对 Agent 本身是不可写的(甚至默认不可见),以防止 Persona 彻底失控。

  • 记忆增强: 原生支持外挂向量数据库作为持久记忆库,并在系统 Prompt 层面做了专门的上下文注入优化。

Hermes 更新记忆


三、 社区生态与综合建议

维度OpenClawHermes
社区活跃度极高,文档多语言覆盖,周边 Skill 库丰富适中,目前以资深玩家和开发者为主
工程稳定性网关架构成熟,适合大规模接入逻辑闭环更优,适合个人高频使用
扩展性Skill 市场极大,即插即用能力强可复用 OpenClaw 社区生态,上限更高

调研总结:

  • 如果你需要一套成熟的网关系统来管理多个模型和大量用户,且愿意花时间通过 CLI 进行深度调优,OpenClaw 是更稳健的选择。
  • 如果你追求 Agent 的自主性,特别是对浏览器自动化有强需求,且希望 Agent 能在长期交互中保持较好的认知一致性,Hermes 在产品理念和细节实现上更具前瞻性。