Knowledge Atlas tăng thông lượng tác nhân AI lên 132% với GLM-5

Trong một động thái thách thức chi phí triển khai trí tuệ nhân tạo đắt đỏ, Knowledge Atlas (02513.HK) đã đạt được mức tăng 132% tốc độ xử lý của mô hình GLM-5 cho các nhiệm vụ lập trình, một sự gia tăng hiệu quả đáng kể có thể hạ thấp rào cản tài chính cho việc áp dụng AI trong doanh nghiệp.

Công ty đã trình bày chi tiết về bước đột phá hiệu suất trong một bài đăng trên blog kỹ thuật, cho biết các tối ưu hóa tập trung vào các kịch bản triển khai "Tác nhân Lập trình" quy mô cực lớn. Đội ngũ kỹ thuật của công ty viết: "Sau khi tối ưu hóa kỹ thuật nền tảng, dòng GLM-5 đã đạt được mức tăng thông lượng hệ thống lên tới 132%".

Báo cáo kỹ thuật nêu rõ rằng những cải tiến này cũng giúp tăng đáng kể độ ổn định của mô hình, với tỷ lệ đầu ra bất thường của hệ thống giảm từ khoảng 10 trên 10.000 xuống dưới 3 trên 10.000. Knowledge Atlas cũng đã gửi bản sửa lỗi của mình cho cộng đồng nhà phát triển rộng lớn hơn thông qua một yêu cầu kéo (pull request) tới SGLang, một khung suy luận mã nguồn mở phổ biến, báo hiệu cam kết thúc đẩy công nghệ nền tảng cho tất cả người dùng.

Bước đột phá này có ý nghĩa quan trọng đối với các nhà đầu tư vì nó trực tiếp giải quyết rào cản lớn nhất đối với việc áp dụng AI: chi phí vận hành khổng lồ. Bằng cách tăng thông lượng—số lượng nhiệm vụ mà một mô hình có thể thực hiện trong một thời gian nhất định—các công ty có thể phục vụ nhiều người dùng hơn với cùng một phần cứng, cải thiện trực tiếp lợi nhuận trên vốn đầu tư cho cơ sở hạ tầng AI đắt đỏ, vốn thường dựa vào GPU từ các nhà cung cấp như Nvidia.

Cắt giảm chi phí, tăng cường độ tin cậy

Lợi ích kép từ thông lượng cao hơn và tỷ lệ lỗi thấp hơn mang lại cho Knowledge Atlas một lợi thế cạnh tranh hấp dẫn. Đối với các doanh nghiệp đang tìm cách triển khai các trợ lý lập trình AI, giúp các nhà phát triển viết và sửa lỗi mã, độ tin cậy cũng quan trọng như hiệu suất. Một tác nhân AI tạo ra ít lỗi hơn sẽ đáng tin cậy hơn và ít cần sự giám sát của con người hơn, làm giảm thêm sự ma sát trong vận hành.

Quyết định đóng góp tối ưu hóa của mình trở lại dự án SGLang mã nguồn mở của công ty cũng là một quyết định chiến lược. Nó nâng cao danh tiếng của Knowledge Atlas với tư cách là một nhà lãnh đạo kỹ thuật và tạo được thiện cảm trong cộng đồng phát triển AI. Điều này có thể thu hút các tài năng kỹ thuật hàng đầu và khuyến khích các nhà phát triển đã quen thuộc với khung SGLang cải tiến áp dụng rộng rãi hơn các mô hình của công ty. Bản sửa lỗi cụ thể đã được gửi trong Pull Request #22811 cho cộng đồng SGLang.

Đối với Knowledge Atlas, một tổ chức niêm yết trên Sở Giao dịch Chứng khoán Hồng Kông, tiến bộ kỹ thuật này có thể chuyển thành vị thế thị trường mạnh mẽ hơn. Khi ngành công nghiệp AI trưởng thành, trọng tâm đang chuyển từ năng lực mô hình thuần túy sang triển khai hiệu quả, có khả năng mở rộng và tiết kiệm chi phí. Hiệu suất đã được chứng minh của dòng GLM-5 trong lĩnh vực này có thể thu hút một làn sóng khách hàng doanh nghiệp mới, thúc đẩy tăng trưởng doanh thu và mang lại sự khác biệt rõ rệt trong một thị trường đông đúc.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.