AI技术

Harness Agent 选型必看：OpenClaw & Hermes 全维度对比实测

前言： AI 及其应用生态正处于超高速迭代期，半月甚至周级的版本更新已成常态。
效期： 本文内容基于 2026 年 4 月下旬 的实测得出。
环境： 所有测试均在 gpt-oss:120b 本地部署模型下完成，旨在横向对比框架本身的逻辑设计与工具集成质量，LLM 质量不在考察范围内。

一、服务架构与运维设计

两者的核心差异在于设计重心的分化：

OpenClaw（网关重心）： 采用“中枢式”设计。网关接管一切长期运行的资源（会话、LLM 路由、多用户管理）。其 Skill（技能）与记忆层高度依赖外部插件或手动干预，适合作为“AI 基础设施”进行统一调度。
Hermes（Agent 重心）： 侧重“个体进化”。Agent 内部集成了更复杂的改进循环。网关更多承担接入层功能，而 Skill 的调度与记忆的剪枝更倾向于由 Agent 自主完成。

1.1 网关与 UI 体验

OpenClaw
OpenClaw 网关截图
提供开箱即用的 WebUI，但在工程实践中，深度配置仍高度依赖 CLI 或直接修改配置文件。UI 层的逻辑兼容性尚不完善，且汉化质量粗糙，更适合习惯“配置驱动”的开发者。

Hermes
Hermes-web-ui 截图
原生 UI 较为简陋。目前主流方案是配合 Hermes-web-ui 项目使用，涵盖了基础的配置与对话管理。但在处理复杂逻辑时，依然无法完全脱离后端配置。

1.2 执行沙箱 (Sandbox)

两者均支持多后端驱动，决定了 Agent 指令执行的安全性与灵活性。

Hermes-Terminal-backend 配置

Docker 模式
- 特性： 强隔离、高安全性，支持会话级的环境彻底抹除。
- 痛点： 资源开销大，启动存在秒级延迟。若涉及 GPU 任务（如本地视觉解析），Docker 穿透配置成本较高。
- 建议： 生产环境下运行未经审核的第三方脚本的首选方案。
SSH 模式
- 特性： 将指令投递至远程或特定环境运行。
- 适用： 需要在特定物理机或已有工作流中嵌入 Agent 能力的场景。
Local 模式
- 警告： 无隔离直接操作宿主机。虽为 Hermes 默认值（追求响应速度），但在非隔离环境（如 WSL 外）建议谨慎开启。

1.3 安全审计与成本监控

安全防御： 二者均具备指令/用户白名单机制。Hermes 的优势在于引入了 LLM 审计模式，即通过消耗少量额外的 Token，利用轻量级模型预判指令风险，实现“低风险自动放行、高风险人工拦截”的平衡。
Token 追踪：

均支持多模型费用看板。OpenClaw 的可观测性更佳，提供更细粒度的流量统计与任务分布图表。

二、核心功能特性与实测体验

2.1 浏览器自动化 (Browser Automation)

目前的通用方案是将页面内容结构化（类似 MCP 协议），使 Agent 具备“读网”能力。但实测证明，这种“纯文本驱动”的方式仍存在技术瓶颈：

视觉盲区： 无法理解图像、复杂的 CSS 排版信息。
交互失效： 难以处理由 JS 监听的动态加载内容（如滚动触发、悬停渲染）。
定位偏差： 缺乏精确坐标映射，导致 Agent 在复杂表单中频繁误触。

实测：OpenClaw

在 120b 模型下，面对点赞、评论等交互任务：

agent-browser 工具： 使用无头浏览器。虽能读取 DOM，但在多轮对话引导下，依然无法精准定位点赞按钮，存在严重的“元素定位漂移”。
内置 browser 工具： 配置链路极长，且与 Agent 内部逻辑存在明显的 Schema 不匹配。实测过程中频繁报 Timeout 错误，工程化成熟度较低。

无法完成点赞任务

实测：Hermes

内置 browser 工具： 易用性完胜。在 WSL 下配合 Chrome 可直接弹出宿主机窗口，实现 “可见即可得” 的操作。
局限性： Snapshot 工具虽然能抓取全量 DOM，但由于缺乏“滚动-校验-点击”的原子级状态机闭环，Agent 容易产生“我能看见所有元素”的幻觉，尝试点击视窗外的元素导致任务失败。

自动操作示意图

2.2 自我认知与持久记忆

OpenClaw：开放但松散
OpenClaw 人格文件举例
虽支持 SOUL.md 等设定文件，但缺乏原生的“进化闭环”。若无 self-evolve 等外部技能干预，Agent 难以自主迭代性格。实测中发现，Agent 偶尔会发生认知混淆，例如将本应属于“设定”的内容误写入“业务记忆”文件。

Hermes：管控下的闭环
Hermes 中的自我认知处理
设计更严谨。soul 等核心配置文件对 Agent 本身是不可写的（甚至默认不可见），以防止 Persona 彻底失控。

记忆增强： 原生支持外挂向量数据库作为持久记忆库，并在系统 Prompt 层面做了专门的上下文注入优化。

Hermes 更新记忆

三、社区生态与综合建议

维度	OpenClaw	Hermes
社区活跃度	极高，文档多语言覆盖，周边 Skill 库丰富	适中，目前以资深玩家和开发者为主
工程稳定性	网关架构成熟，适合大规模接入	逻辑闭环更优，适合个人高频使用
扩展性	Skill 市场极大，即插即用能力强	可复用 OpenClaw 社区生态，上限更高

调研总结：

如果你需要一套成熟的网关系统来管理多个模型和大量用户，且愿意花时间通过 CLI 进行深度调优，OpenClaw 是更稳健的选择。
如果你追求 Agent 的自主性，特别是对浏览器自动化有强需求，且希望 Agent 能在长期交互中保持较好的认知一致性，Hermes 在产品理念和细节实现上更具前瞻性。

If you find the article useful, feel free to appreciate

实录调研

Harness Agent 选型必看：OpenClaw & Hermes 全维度对比实测

https://mori.plus/archives/openclaw-hermes

Author

猫立桑

Published on

2026-04-28

Updated on

2026-04-28

License

CC BY 4.0

Harness Agent 选型必看：OpenClaw & Hermes 全维度对比实测

一、 服务架构与运维设计

1.1 网关与 UI 体验

1.2 执行沙箱 (Sandbox)

1.3 安全审计与成本监控

二、 核心功能特性与实测体验

2.1 浏览器自动化 (Browser Automation)

实测：OpenClaw

实测：Hermes

2.2 自我认知与持久记忆

三、 社区生态与综合建议

Author

Published on

Updated on

License

Comments

一、服务架构与运维设计

二、核心功能特性与实测体验

三、社区生态与综合建议