一款新型開源 AI 智能體 Hermes 通過將智能體開發中最乏味的兩個部分——技能創建和用戶特定記憶——實現自動化,在 GitHub 上吸引了超過 2.2 萬顆星。
返回
一款新型開源 AI 智能體 Hermes 通過將智能體開發中最乏味的兩個部分——技能創建和用戶特定記憶——實現自動化,在 GitHub 上吸引了超過 2.2 萬顆星。

(P1) 一款名為 Hermes Agent 的新型 AI 智能體框架已連續數週蟬聯 GitHub 趨勢榜首,累計獲得超過 2.2 萬顆星,並對前輩 OpenClaw 的主導地位發起了挑戰。雖然這兩款智能體在功能上看似相近,但 Hermes 引入了一種激進的全自動化理念,正在為行業設定新方向,將其價值主張從開發工具推向自主合作夥伴。
(P2) Hermes 自我進化技能系統的技術核心基於「遺傳-帕累托提示進化」(GEPA)算法,該算法詳見 Lakshya Agrawal 等人發表的一篇 ICLR 2026 論文。論文指出:「反思性提示進化優於強化學習」,這為 Hermes 偏離傳統的基於強化學習(RL)的技能增強路徑提供了學術支撐。
(P3) Hermes 的差異化源於兩大關鍵自動化系統。首先是自我進化的技能系統,當某個工具被使用超過五次或錯誤被修復時,它會自動生成新的工作流,隨後利用 GEPA 算法進行離線優化。其次是主動記憶系統,每隔 15 輪對話便使用一種「提醒」機制主動反思並保存用戶偏好,這與 OpenClaw 那種僅用於防止上下文溢出的被動記憶保存形成了鮮明對比。
(P4) Hermes 的迅速崛起預示著規模達 250 億美元的 AI 開發市場可能發生範式轉移。其成功表明開發者對減少手動配置並能主動學習的智能體有著強烈需求。這可能會加速圍繞優質開源項目的併購活動,並迫使像 Anthropic 這樣被公開指責抄襲 Hermes 功能的老牌企業轉向更加自動化、以用戶為中心的設計理念。
Hermes 與其競爭對手之間最顯著的結構性差異在於其技能自動進化的閉環系統。OpenClaw 要求用戶手動創建、安裝和授權新技能,而 Hermes 則將這一過程完全自動化。系統會自動將涉及 5 次或更多工具調用的成功工作流封裝成新的技能文件。
隨後,在 hermes-agent-self-evolution 倉庫中詳細描述的一個獨立離線流程會利用 DSPy 框架和 GEPA 算法來精煉這些技能。該算法基於三個概念:反思性突變(模型分析執行軌跡以進行針對性更改)、帕累托前沿選擇(保留多樣化的高性能技能變體)以及將自然語言反饋作為突變的主要信號。此過程會生成一個合併請求(PR)供人工審核,確保「人在迴路」中保持對智能體核心能力的最終控制,從而打破了系統可以在無用戶監督下運行的迷思。
Hermes 的第二大核心創新是其激進的主動記憶系統。像 Claude Code 這樣的競爭對手,其記憶系統被嚴格限制在單一項目中,而 OpenClaw 僅在上下文窗口即將溢出時才被動保存記憶,與之不同,Hermes 採取了截然不同的方法。大約每 15 輪對話,一種「提醒」機制就會迫使智能體反思交互過程,並決定是否有任何用戶偏好或事實值得永久記住。
這種高頻、主動的方法確保了隨著時間的推移能構建出更豐富用戶模型。該系統通過內置的 SQLite FTS5 全文搜索功能得到進一步增強,使智能體能夠瞬間找回過去的交互記錄,而無需依賴外部向量數據庫。雖然在早期版本中,高級 AI 原生記憶後端 Honcho 是默認配置,但在 v0.7 更新中,它變成了可選插件,優先考慮了更簡單的內置系統的穩定性,並賦予用戶更多控制權。
Hermes 的自動化是通過用確定性的硬編碼規則取代靈活的模型判斷來實現的。系統的複雜性並未消除,而是從用戶的責任轉移到了智能體的底層代碼中。何時生成技能(5 次工具調用)或何時反思記憶(15 輪對話)等決策由僵化的 if-then 邏輯控制,而非大語言模型(LLM)的推理。
這種設計選擇是針對當前 LLM 在管理長上下文方面的局限性而採取務實的工程方案——研究表明,在長上下文中性能可能下降超過 39%。當對話達到上下文限制的 85% 時,Hermes 使用簡單的字符串替換進行壓縮,而不是冒著 AI 生成摘要出錯的風險。這種保守的、基於規則的方法確保了穩定性和可預測性,Hermes 的創建者堅信,相比於性能不穩定且不可靠的完全自主 LLM,這對用戶來說更有價值。該策略旨在現階段建立生態系統,並等待模型改進逐漸提升安全自動化的上限。
本文僅供信息參考,不構成投資建議。