Hermes Agent đã sử dụng 2 tính năng tự động hóa như thế nào để vượt mặt OpenClaw

(P1) Một khung tác nhân AI mới mang tên Hermes Agent đã chiếm giữ vị trí đầu bảng xu hướng của GitHub trong nhiều tuần, tích lũy hơn 22.000 sao và thách thức sự thống trị của người tiền nhiệm OpenClaw. Mặc dù cả hai tác nhân có vẻ tương đồng về chức năng, nhưng Hermes giới thiệu một triết lý triệt để về tự động hóa hoàn toàn, đang thiết lập một hướng đi mới cho ngành công nghiệp, chuyển đổi giá trị từ một công cụ phát triển sang một đối tác tự trị.

(P2) Cốt lõi kỹ thuật của hệ thống kỹ năng tự phát triển của Hermes dựa trên thuật toán Genetic-Pareto Prompt Evolution (GEPA), được trình bày chi tiết trong một bài báo tại ICLR 2026 của Lakshya Agrawal và các cộng sự. Bài báo lập luận rằng "Sự tiến hóa của lời nhắc mang tính phản biện có thể vượt qua học tăng cường", cung cấp nền tảng học thuật cho việc Hermes từ bỏ phương pháp tăng cường kỹ năng dựa trên RL truyền thống.

(P3) Sự khác biệt của Hermes đến từ hai hệ thống tự động quan trọng. Thứ nhất là hệ thống kỹ năng tự phát triển, âm thầm tạo ra các quy trình làm việc mới khi một công cụ được sử dụng hơn năm lần hoặc một lỗi được khắc phục. Các kỹ năng này sau đó được tối ưu hóa ngoại tuyến bằng thuật toán GEPA. Thứ hai là hệ thống bộ nhớ chủ động sử dụng cơ chế "thúc đẩy" (nudge) sau mỗi 15 lượt hội thoại để tích cực phản ánh và lưu trữ sở thích của người dùng, một sự tương phản rõ rệt với việc lưu trữ bộ nhớ thụ động, chỉ nhằm ngăn chặn tràn ngữ cảnh của OpenClaw.

(P4) Sự trỗi dậy nhanh chóng của Hermes báo hiệu một sự thay đổi mô hình tiềm năng cho thị trường phát triển AI trị giá 25 tỷ USD. Thành công của nó cho thấy nhu cầu mạnh mẽ của các nhà phát triển đối với các tác nhân giúp giảm bớt cấu hình thủ công và chủ động học hỏi. Điều này có thể đẩy nhanh hoạt động M&A xung quanh các dự án mã nguồn mở đầy hứa hẹn và buộc các tên tuổi đã thành danh như Anthropic — đơn vị từng bị công khai cáo buộc sao chép các tính năng của Hermes — phải áp dụng triết lý thiết kế tự động và tập trung vào người dùng hơn.

Kỹ năng tự phát triển định nghĩa lại quy trình làm việc của tác nhân

Sự khác biệt cấu trúc đáng kể nhất giữa Hermes và các đối thủ là hệ thống vòng lặp kín để tự động phát triển kỹ năng. Trong khi OpenClaw yêu cầu người dùng tạo, cài đặt và cấp quyền cho các kỹ năng mới một cách thủ công, Hermes tự động hóa hoàn toàn quá trình này. Hệ thống sẽ âm thầm đóng gói bất kỳ quy trình làm việc thành công nào liên quan đến năm lần gọi công cụ trở lên thành một tệp kỹ năng mới.

Sau đó, một quy trình ngoại tuyến riêng biệt được mô tả chi tiết trong kho lưu trữ hermes-agent-self-evolution sử dụng khung DSPy và thuật toán GEPA để tinh chỉnh các kỹ năng này. Thuật toán này dựa trên ba khái niệm: đột biến phản biện, nơi mô hình phân tích các dấu vết thực thi để thực hiện các thay đổi có mục tiêu; lựa chọn biên Pareto, giúp bảo tồn một tập hợp đa dạng các biến thể kỹ năng hiệu suất cao; và sử dụng phản hồi bằng ngôn ngữ tự nhiên làm tín hiệu chính cho đột biến. Quy trình này tạo ra một yêu cầu kéo (pull request) để con người xem xét, đảm bảo cơ chế "con người kiểm soát" (human-in-the-loop) duy trì quyền kiểm soát cuối cùng đối với các khả năng cốt lõi của tác nhân, bác bỏ huyền thoại về một hệ thống hoạt động mà không có sự giám sát của người dùng.

Bộ nhớ chủ động tạo ra một tác nhân cá nhân hóa hơn

Cải tiến quan trọng thứ hai của Hermes là hệ thống bộ nhớ chủ động và quyết liệt. Trong khi các đối thủ cạnh tranh như Claude Code có hệ thống bộ nhớ bị cô lập nghiêm ngặt trong một dự án duy nhất và OpenClaw chỉ lưu trữ bộ nhớ một cách thụ động trước khi cửa sổ ngữ cảnh bị tràn, Hermes lại thực hiện một cách tiếp cận khác. Cứ sau khoảng 15 lượt hội thoại, một cơ chế "thúc đẩy" buộc tác nhân phải phản ánh về tương tác và quyết định xem có bất kỳ sở thích hoặc sự kiện nào của người dùng đáng để ghi nhớ vĩnh viễn hay không.

Cách tiếp cận chủ động, tần suất cao này đảm bảo một mô hình người dùng phong phú hơn nhiều được xây dựng theo thời gian. Hệ thống được tăng cường thêm bởi khả năng tìm kiếm toàn văn SQLite FTS5 tích hợp, cho phép tác nhân truy xuất ngay lập tức các tương tác trong quá khứ mà không cần dựa vào cơ sở dữ liệu vector bên ngoài. Mặc dù bộ nhớ phụ trợ gốc AI tiên tiến Honcho là mặc định trong các phiên bản trước, bản cập nhật v0.7 đã biến nó thành một plugin tùy chọn, ưu tiên tính ổn định của hệ thống tích hợp đơn giản hơn và mang lại cho người dùng nhiều quyền kiểm soát hơn.

Sự đánh đổi: Che giấu sự phức tạp bằng các quy tắc cứng nhắc

Sự tự động hóa của Hermes đạt được bằng cách thay thế các đánh giá dựa trên mô hình linh hoạt bằng các quy tắc cứng nhắc, mang tính xác định. Sự phức tạp của hệ thống không bị loại bỏ mà được chuyển từ trách nhiệm của người dùng sang mã nguồn cơ bản của tác nhân. Các quyết định như khi nào tạo kỹ năng (5 lần gọi công cụ) hoặc khi nào phản ánh bộ nhớ (15 lượt) được quản trị bởi logic if-then cứng nhắc, chứ không phải là suy luận của LLM.

Lựa chọn thiết kế này là một giải pháp kỹ thuật thực dụng cho những hạn chế hiện tại của LLM trong việc quản lý ngữ cảnh dài, nơi các nghiên cứu đã chỉ ra rằng hiệu suất có thể giảm hơn 39%. Khi một cuộc hội thoại đạt 85% giới hạn ngữ cảnh, Hermes sử dụng thay thế chuỗi đơn giản để nén thay vì mạo hiểm với một bản tóm tắt do AI tạo ra có thể bị lỗi. Cách tiếp cận dựa trên quy tắc, bảo thủ này đảm bảo tính ổn định và khả năng dự đoán, điều mà những người sáng tạo ra Hermes đặt cược là có giá trị hơn đối với người dùng so với hiệu suất mong manh của một LLM hoàn toàn tự trị nhưng không đáng tin cậy. Chiến lược là thiết lập một hệ sinh thái ngay bây giờ và chờ đợi những cải tiến của mô hình để dần dần nâng cao giới hạn của những gì có thể tự động hóa một cách an toàn.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.