MiniMax đã mở mã nguồn mô hình M2.7, AI tác nhân (agentic AI) đầu tiên trong ngành tích cực tham gia và cải thiện chu kỳ phát triển của chính mình, đạt được hiệu suất ngang bằng với các mô hình độc quyền hàng đầu.
MiniMax đã chính thức mở mã nguồn MiniMax M2.7, mô hình Hỗn hợp chuyên gia (Mixture-of-Experts - MoE) mạnh mẽ nhất của mình, công khai các trọng số trên Hugging Face. Mô hình này, vốn đã tham gia vào quá trình phát triển của chính mình để đạt được mức tăng 30% hiệu suất, đạt 56,22% trên bài kiểm tra kỹ thuật phần mềm SWE-Pro, ngang bằng với GPT-5.3-Codex và báo hiệu một mặt trận cạnh tranh mới trong thị trường AI mã nguồn mở.
"Để kiểm tra ranh giới của việc tự cải thiện, MiniMax M2.7 đã được giao nhiệm vụ tối ưu hóa hiệu suất lập trình của một mô hình trên một khung thử nghiệm nội bộ," công ty cho biết trong một bài đăng blog kỹ thuật. "Nó đã chạy hoàn toàn tự động, thực hiện một vòng lặp lặp đi lặp lại gồm 'phân tích quỹ đạo thất bại → lập kế hoạch thay đổi → sửa đổi mã khung → chạy đánh giá → so sánh kết quả → quyết định giữ lại hoặc hoàn tác các thay đổi' trong hơn 100 vòng."
Quá trình tự tiến hóa này đã dẫn đến sự cải thiện hiệu suất 30% trong các đánh giá nội bộ. Trên các bài kiểm tra công khai, M2.7 đạt được kết quả hàng đầu cho các mô hình mã nguồn mở, ghi được 57,0% trên Terminal Bench 2 và 55,6% trên bài kiểm tra tạo mã cấp kho lưu trữ VIBE-Pro, gần tương đương với Opus 4.6 của Anthropic. Mô hình được phát triển với sự hợp tác của các nhà sản xuất phần cứng bao gồm Nvidia, Huawei Ascend và Moore Threads, đảm bảo khả năng tương thích ban đầu rộng rãi.
Việc phát hành này thách thức khoảng cách hiệu suất giữa các mô hình mã nguồn mở và các mô hình độc quyền từ các công ty như OpenAI và Anthropic. Bằng cách mở mã nguồn một mô hình có khả năng tự cải thiện và hiệu suất cao trong các tác vụ kỹ thuật thực tế phức tạp, MiniMax gây áp lực lên các đối thủ hiện tại và cung cấp một công cụ mạnh mẽ, có thể truy cập tự do cho các nhà phát triển, có khả năng làm thay đổi việc mua sắm AI của doanh nghiệp từ các hệ thống dựa trên API tốn kém.
Một kiến trúc mới cho công việc tác nhân
MiniMax M2.7 là một phần của dòng mô hình Hỗn hợp chuyên gia (MoE) M2 của công ty. Kiến trúc này hiệu quả hơn các mô hình dày đặc (dense models), vì chỉ có một tập hợp con các tham số được kích hoạt trong quá trình suy luận, giúp nó chạy nhanh hơn và rẻ hơn. Mô hình được xây dựng dựa trên ba khả năng cốt lõi: kỹ thuật phần mềm chuyên nghiệp, công việc văn phòng chuyên nghiệp và sự hợp tác đa tác nhân bản địa, mà MiniMax gọi là "Đội ngũ tác nhân" (Agent Teams). Những khả năng này cho phép M2.7 hoàn thành các nhiệm vụ năng suất phức tạp bằng cách tận dụng các kỹ năng phức tạp và tìm kiếm công cụ linh hoạt.
Xuất sắc trong kỹ thuật thực tế
Hiệu suất của mô hình trên các bài kiểm tra mô phỏng các thách thức kỹ thuật thực tế đã làm nó nổi bật. Trên SWE-Pro, bao gồm các tác vụ như phân tích nhật ký, khắc phục lỗi và xem xét bảo mật mã, độ chính xác 56,22% của M2.7 ngang bằng với GPT-5.3-Codex. Điều này chứng minh khả năng hiểu logic vận hành của các hệ thống phần mềm, không chỉ đơn thuần là tạo mã. Nhóm MiniMax báo cáo rằng khả năng này đã được sử dụng nội bộ để giảm thời gian khôi phục cho các sự cố hệ thống sản xuất thực tế xuống dưới ba phút, với việc mô hình tự động thực hiện phân tích khả năng quan sát, truy vấn cơ sở dữ liệu và gửi các yêu cầu hợp nhất (merge requests).
Vượt xa kỹ thuật: Kỹ năng văn phòng và tài chính chuyên nghiệp
Ngoài sức mạnh kỹ thuật, MiniMax M2.7 còn hướng tới các tác vụ văn phòng chuyên nghiệp. Trong đánh giá GDPval-AA, đo lường kiến thức chuyên môn trong 45 mô hình, M2.7 đã đạt được điểm ELO là 1495, cao nhất trong số tất cả các mô hình mã nguồn mở và chỉ đứng sau các mô hình độc quyền hàng đầu như Opus 4.6 và GPT-5.4. Trong tài chính, mô hình có thể đóng vai trò như một nhà phân tích sơ cấp, có khả năng tự đọc báo cáo thường niên, xây dựng mô hình dự báo doanh thu và tạo báo cáo nghiên cứu. Bộ kỹ năng rộng lớn này biến nó thành đối thủ cạnh tranh trực tiếp với các mô hình được định vị cho doanh nghiệp và sử dụng chuyên nghiệp. Việc mở mã nguồn một mô hình với các khả năng đã được kiểm chứng này có thể thúc đẩy việc áp dụng các quy trình làm việc AI tác nhân trong nhiều ngành công nghiệp khác nhau, ảnh hưởng đến mô hình kinh doanh của các công ty dựa vào việc bán quyền truy cập vào các hệ thống mã nguồn đóng tương tự.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.