MiniMax đã phát hành mô hình chủ lực M3 vào hôm thứ Hai, tuyên bố hiệu suất lập trình hàng đầu vượt qua GPT-5.5 trên điểm chuẩn SWE-Bench Pro, khi startup AI Trung Quốc này theo đuổi đợt niêm yết thứ cấp trên Sàn STAR Market của Thượng Hải sau khi cổ phiếu Hong Kong của hãng tăng vọt 409% kể từ tháng 1.
Mô hình này đạt điểm cao hơn GPT-5.5 của OpenAI và Gemini 3.1 Pro của Google trên SWE-Bench Pro, một điểm chuẩn đo lường các nhiệm vụ kỹ thuật phần mềm trong thế giới thực, và chỉ xếp sau Claude Opus 4.7 của Anthropic, MiniMax cho biết trong một tuyên bố. Trên Claw-Eval, một bài đánh giá từ đầu đến cuối dành cho các tác nhân tự động, M3 đạt điểm cao nhất trong số tất cả các mô hình được thử nghiệm.
"M3 là mô hình mã nguồn mở duy nhất đồng thời cung cấp khả năng lập trình tiên tiến, cửa sổ ngữ cảnh 1 triệu token và xử lý đa phương thức gốc," MiniMax cho biết trong thông báo của mình.
Ba nhánh công nghệ, một mô hình
M3 giới thiệu MiniMax Sparse Attention, hay MSA, một kiến trúc chú ý mới được thiết kế để giải quyết chi phí tính toán bậc hai của xử lý ngữ cảnh dài. Cơ chế này sử dụng phương pháp hai giai đoạn: giai đoạn Index Attention nhẹ chọn các khối KV liên quan hàng đầu thông qua block max pooling, sau đó là tính toán chú ý thưa đầy đủ chỉ trên các khối đó. Ở mức 1 triệu token, chi phí tính toán trên mỗi token của M3 chỉ bằng 1/20 so với phiên bản tiền nhiệm, với tốc độ điền trước nhanh hơn 9,7 lần và tốc độ giải mã nhanh hơn 15,6 lần, theo MiniMax.
Công ty cho biết M3 được huấn luyện trên dữ liệu văn bản-hình ảnh xen kẽ từ bước tiền huấn luyện đầu tiên, với đường ống dữ liệu được xây dựng lại để xử lý tới 100 nghìn tỷ token. MiniMax đã mã nguồn mở hóa các mô hình M2.5 và M2.7 đầu năm nay và cho biết trọng số của M3 cùng báo cáo kỹ thuật sẽ được công bố trong vòng 10 ngày tới.
Để chứng minh khả năng kết hợp của mô hình, MiniMax đã giao cho M3 nhiệm vụ tái tạo độc lập một bài báo đạt Giải thưởng Bài báo Xuất sắc ICLR 2025 về động lực học trong quá trình tinh chỉnh. Mô hình đã chạy trong khoảng 12 giờ mà không có sự can thiệp của con người, tạo ra 18 commit và 23 biểu đồ thí nghiệm. Nó đã tái tạo thành công các thí nghiệm cốt lõi của bài báo, bao gồm hiệu ứng squeezing quan sát được trong huấn luyện DPO và hiệu quả của phương pháp giảm thiểu Extend được đề xuất.
Trong một thử nghiệm riêng biệt, M3 đã tối ưu hóa một nhân nhân ma trận FP8 trên kiến trúc Hopper của Nvidia, bắt đầu từ một khung xương Triton không hoạt động. Trong 24 giờ, mô hình đã gửi 147 điểm chuẩn và 1.959 lệnh gọi công cụ, đẩy mức sử dụng phần cứng đỉnh của Hopper FP8 từ 7,6% lên 71,3% — tăng tốc 9,4 lần. Hầu hết các mô hình cạnh tranh ngừng tiến triển trong vòng 30 lần gửi; kết quả tối ưu của M3 đến ở lần gửi thứ 145.
Động lực IPO và bối cảnh tài chính
Việc ra mắt mô hình diễn ra vài ngày sau khi MiniMax nộp báo cáo tư vấn niêm yết lên CSRC Thượng Hải vào ngày 29 tháng 5, khởi động quy trình IPO cổ phiếu A với CITIC Securities làm cố vấn. Công ty đã lên sàn Hong Kong vào tháng 1 với giá 165 HK$ mỗi cổ phiếu, huy động được khoảng 619 triệu USD. Cổ phiếu của hãng đóng cửa ở mức 840 HK$ vào ngày 29 tháng 5, định giá công ty ở mức 263,45 tỷ HK$, tương đương khoảng 33,8 tỷ USD.
Doanh thu định kỳ hàng năm của MiniMax đã vượt quá 300 triệu USD tính đến cuối tháng 5, tăng hơn gấp đôi trong hai tháng, theo các chỉ số kinh doanh được công bố vào ngày 28 tháng 5. Công ty báo cáo doanh thu năm 2025 đạt 79 triệu USD với biên lợi nhuận gộp 25,4% và lỗ ròng điều chỉnh 250 triệu USD. Hãng có hơn 1 triệu khách hàng doanh nghiệp và nhà phát triển cùng khoảng 300 triệu người dùng toàn cầu.
Việc niêm yết tại Thượng Hải sẽ giúp MiniMax tiếp cận thị trường vốn nội địa sâu hơn vào thời điểm Bắc Kinh đã tín hiệu muốn các nhà vô địch AI của mình được tài trợ trong nước. Công ty gia nhập cùng các đối thủ bao gồm Zhipu và Moonshot trong việc theo đuổi niêm yết đại chúng khi lĩnh vực AI của Trung Quốc đang chạy đua để chuyển đổi uy tín kỹ thuật thành vốn hóa thị trường.
Cổ phiếu MiniMax, tăng hơn 400% so với giá IPO, đang giao dịch ở mức định giá cao hơn đáng kể so với hầu hết các đối thủ AI toàn cầu. Công ty sẽ gia nhập Chỉ số Hang Seng Tech vào ngày 8 tháng 6. Liệu hiệu suất điểm chuẩn của M3 có thể duy trì được mức định giá đó hay không — và liệu đợt niêm yết trên Sàn STAR Market có tiến triển với các điều khoản tương tự hay không — sẽ phụ thuộc vào khả năng của mô hình trong việc chuyển đổi chiến thắng kỹ thuật thành doanh thu doanh nghiệp trên quy mô lớn.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.