새로운 오픈 소스 AI 에이전트인 Hermes는 에이전트 개발에서 가장 번거로운 두 가지 요소인 스킬 생성과 사용자 맞춤형 메모리를 자동화함으로써 GitHub에서 22,000개 이상의 스타를 획득했습니다.
뒤로
새로운 오픈 소스 AI 에이전트인 Hermes는 에이전트 개발에서 가장 번거로운 두 가지 요소인 스킬 생성과 사용자 맞춤형 메모리를 자동화함으로써 GitHub에서 22,000개 이상의 스타를 획득했습니다.

(P1) 새로운 AI 에이전트 프레임워크인 Hermes Agent가 몇 주 동안 GitHub 트렌드 순위 1위를 차지하며 22,000개 이상의 스타를 획득, 이전 모델인 OpenClaw의 지배력에 도전하고 있습니다. 두 에이전트 모두 기능적으로는 유사해 보이지만, Hermes는 업계의 새로운 방향을 설정하는 완전 자동화라는 급진적인 철학을 도입하여 개발 도구에서 자율적인 파트너로 가치 제안을 확장하고 있습니다.
(P2) Hermes의 자가 진화형 스킬 시스템의 기술적 핵심은 Lakshya Agrawal 등이 발표한 ICLR 2026 논문에 상세히 설명된 GEPA(Genetic-Pareto Prompt Evolution) 알고리즘에 기반합니다. "성찰적 프롬프트 진화가 강화 학습을 능가할 수 있다"는 이 논문의 주장은 전통적인 RL 기반 스킬 향상 방식에서 벗어난 Hermes의 학술적 근거가 됩니다.
(P3) Hermes의 차별점은 두 가지 핵심 자동화 시스템에서 나옵니다. 첫째, 자가 진화형 스킬 시스템은 도구가 5회 이상 사용되거나 오류가 복구될 때 자동으로 새로운 워크플로우를 생성합니다. 이러한 스킬은 GEPA 알고리즘을 사용하여 오프라인에서 최적화됩니다. 둘째, 선제적 메모리 시스템은 매 15회의 대화마다 '넛지(nudge)' 메커니즘을 사용하여 사용자 선호도를 능동적으로 반영하고 저장합니다. 이는 단순히 컨텍스트 오버플로 방지를 위해 메모리를 저장하는 OpenClaw의 수동적 방식과 극명한 대조를 이룹니다.
(P4) Hermes의 급격한 성장은 250억 달러 규모의 AI 개발 시장에 잠재적인 패러다임 변화를 예고합니다. 이러한 성공은 수동 설정을 줄이고 능동적으로 학습하는 에이전트에 대한 개발자들의 강력한 욕구를 시사합니다. 이는 유망한 오픈 소스 프로젝트를 중심으로 한 M&A 활동을 가속화하고, Hermes의 기능을 모방했다는 공개적 비판을 받은 Anthropic과 같은 기존 플레이어들이 보다 자동화되고 사용자 중심적인 설계 철학을 채택하도록 강요할 수 있습니다.
Hermes와 경쟁 모델 간의 가장 중요한 구조적 차이점은 자동 스킬 진화를 위한 폐쇄 루프 시스템입니다. OpenClaw는 사용자가 새로운 스킬을 수동으로 생성, 설치 및 승인해야 하는 반면, Hermes는 이 프로세스를 완전히 자동화합니다. 이 시스템은 5회 이상의 도구 호출이 포함된 성공적인 워크플로우를 새로운 스킬 파일로 조용히 패키징합니다.
이후 hermes-agent-self-evolution 저장소에 상세히 설명된 별도의 오프라인 프로세스에서 DSPy 프레임워크와 GEPA 알고리즘을 사용하여 이러한 스킬을 정제합니다. 이 알고리즘은 세 가지 개념에 기초합니다. 모델이 실행 궤적을 분석하여 타겟팅된 변경을 수행하는 '성찰적 변이(reflective mutation)', 다양한 고성능 스킬 변형을 보존하는 '파레토 프런티어 선택(Pareto frontier selection)', 그리고 변이의 주요 신호로 자연어 피드백을 사용하는 것입니다. 이 프로세스는 인간의 검토를 위한 풀 리퀘스트를 생성하여 'Human-in-the-loop'가 에이전트의 핵심 기능에 대한 최종 제어권을 유지하도록 보장하며, 사용자 감독 없이 시스템이 작동한다는 신화를 깨뜨립니다.
Hermes의 두 번째 핵심 혁신은 공격적이고 선제적인 메모리 시스템입니다. Claude Code와 같은 경쟁사들이 메모리 시스템을 단일 프로젝트로 엄격히 격리하고, OpenClaw가 컨텍스트 창이 넘치기 직전에만 수동적으로 메모리를 저장하는 것과 달리, Hermes는 다른 접근 방식을 취합니다. 약 15회의 대화 턴마다 '넛지' 메커니즘이 에이전트로 하여금 상호작용을 되돌아보고 영구적으로 기억할 가치가 있는 사용자 선호도나 사실이 있는지 결정하게 합니다.
이러한 고빈도, 능동적 접근 방식은 시간이 지남에 따라 훨씬 더 풍부한 사용자 모델이 구축되도록 보장합니다. 또한 이 시스템은 내장된 SQLite FTS5 전체 텍스트 검색 기능을 통해 더욱 강화되어, 에이전트가 외부 벡터 데이터베이스에 의존하지 않고도 과거의 상호작용을 즉시 호출할 수 있게 합니다. 초기 버전에서는 AI 네이티브 메모리 백엔드인 Honcho가 기본값이었으나, v0.7 업데이트에서 이를 선택적 플러그인으로 변경하여 더 단순한 내장 시스템의 안정성을 우선시하고 사용자에게 더 많은 제어권을 부여했습니다.
Hermes의 자동화는 유연한 모델 기반 판단을 결정론적인 하드코딩 규칙으로 대체함으로써 달성됩니다. 시스템의 복잡성은 제거된 것이 아니라 사용자의 책임에서 에이전트의 기본 코드로 이전된 것입니다. 스킬 생성 시점(도구 호출 5회)이나 메모리 성찰 시점(15턴)과 같은 결정은 LLM의 추론이 아닌 엄격한 if-then 로직에 의해 제어됩니다.
이러한 설계 선택은 연구 결과 성능이 39% 이상 떨어질 수 있는 것으로 나타난 긴 컨텍스트 관리에서의 현재 LLM의 한계에 대한 실용적인 엔지니어링 솔루션입니다. 대화가 컨텍스트 제한의 85%에 도달하면 Hermes는 오류가 발생할 수 있는 AI 생성 요약 대신 단순한 문자열 교체를 사용하여 압축합니다. 이러한 보수적인 규칙 기반 접근 방식은 안정성과 예측 가능성을 보장하며, Hermes 제작자는 이것이 불안정한 완전 자율 LLM의 성능보다 사용자에게 더 가치 있다고 판단했습니다. 전략은 현재 생태계를 구축하고 모델 개선을 통해 안전하게 자동화할 수 있는 범위를 점진적으로 넓혀가는 것입니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.