问题定义
Hermes Agent 是 Nous Research 开发的自我进化 AI 智能体框架。传统 AI 助手无状态,对话结束即归零。Hermes Agent 颠覆了这个前提——它维护跨会话的持久记忆,在完成任务后自动生成可复用的技能文件,并通过 GEPA 自我进化系统持续优化自身策略。
核心特性
自我进化系统
内置闭环学习机制——自动创建技能、持续优化策略、周期性记忆整理,让 Agent 越用越强。
持久记忆系统
跨会话持久记忆,学习用户偏好、项目环境和解决方案。FTS5 全文检索 + LLM 摘要召回。
技能自我改进
任务完成后自动生成可复用技能文件,持续在实战中优化技能质量,积累专家级经验。
多模态理解
支持图像理解、语音识别与合成、Web 搜索与浏览器自动化,覆盖全场景需求。
安全沙箱
5 种后端隔离(本地、Docker、SSH、Singularity、Modal),命名空间隔离与容器加固。
MCP 生态
连接任何 MCP 服务器,灵活扩展工具能力。兼容 agentskills.io 开放技能标准。
快速安装
# 配置
$ hermes setup
# 启动
$ hermes run
架构概览
记忆层
Agent 筛选的记忆
智能筛选重要信息,周期性提醒 + 跨会话 FTS5 召回 + LLM 摘要压缩。
技能层
程序化记忆
Agent 从经验中创建与自我优化的技能文件,兼容 agentskills.io 开放标准。
用户模型 (Honcho)
辩证式用户建模
深度理解用户意图、偏好和工作方式,跨会话持续深化认知。
工具层
47+ 内置工具
支持 MCP 扩展,安全沙箱隔离,支持子代理并行执行。
运行环境
不依赖本地笔记本,支持从 $5 VPS 到 GPU 集群的多种部署方式:
6 种终端后端
本地、Docker、SSH、Daytona、Singularity、Modal
Serverless 持久化
Daytona 与 Modal 空闲时休眠,几乎零成本
15+ 消息平台
CLI、Telegram、Discord、Slack、WhatsApp、Signal、Email 等
定时自动化
自然语言 cron 调度日报、备份、审计、简报
支持的消息平台
核心能力
子代理与并行
派生子代理独立工作,支持并行工作流。代码执行支持多步骤管道单次推理。
语音模式
CLI、Telegram、Discord 实时语音交互,支持语音备忘转录与跨平台继续。
Web 能力
搜索、提取、浏览、视觉理解、图片生成、语音合成、多模型推理。
上下文文件
项目上下文文件塑造每次对话,让 Agent 精准理解项目背景与需求。
研究就绪
批量处理、轨迹导出、RL 训练支持(Atropos),适合 AI 研究场景。
开源项目
Hermes Agent
Nous Research 官方仓库,开源自我进化 AI Agent 实现,MIT 许可证。
官方文档
完整的安装指南、配置说明和使用教程。
Discord 社区
参与讨论,获取帮助,与开发者直接交流。
Skills Hub
社区贡献的开放技能库,可移植、可分享。