Claude AI của Anthropic đối mặt với sự phản đối từ người dùng sau báo cáo hiệu suất giảm 67%

Anthropic đang phải đối mặt với sự phản đối đáng kể từ những người dùng doanh nghiệp trước những tuyên bố rằng mô hình hàng đầu Claude Opus 4.6 của họ đã bị âm thầm "nerfed", hay bị làm cho kém năng lực hơn, với một phân tích cho thấy độ sâu suy luận của mô hình đối với các nhiệm vụ lập trình phức tạp đã giảm 67%. Cuộc tranh cãi đe dọa làm xói mòn niềm tin vào công ty khởi nghiệp trị giá 380 tỷ USD này, đặc biệt là khi nó đang cạnh tranh với các dịch vụ doanh nghiệp của OpenAI và được cho là đang hướng tới việc IPO.

"Khi suy nghĩ trở nên nông cạn, mô hình có xu hướng thực hiện hành động có chi phí thấp nhất," Stella Laurenzo, giám đốc cấp cao về AI tại AMD, đã viết trong một phân tích trên GitHub được lan truyền rộng rãi. "Sửa đổi mà không đọc, dừng lại trước khi hoàn thành, trốn tránh trách nhiệm cho các lỗi lầm của mình và chọn giải pháp đơn giản nhất chứ không phải chính xác nhất."

Cốt lõi của những lời phàn nàn từ người dùng, vốn đã lan rộng trên GitHub, Reddit và X, là việc Claude trở nên kém tin cậy hơn đối với các quy trình làm việc phức tạp, nhiều bước mà nó từng được khen ngợi ban đầu. Một phân tích của Laurenzo trên hơn 6.800 phiên làm việc với Claude Code cho thấy từ cuối tháng 2 đến đầu tháng 3, chỉ số "số lần đọc trên mỗi lần chỉnh sửa" của mô hình — một đại diện cho lượng ngữ cảnh mà nó xem xét trước khi viết mã — đã giảm mạnh từ 6,6 xuống 2,0. Đáp lại, người đứng đầu Claude Code của Anthropic, Boris Cherny, tuyên bố công ty không bí mật làm giảm chất lượng mô hình mà đã thay đổi mức độ "nỗ lực" mặc định thành "trung bình" để cân bằng giữa trí thông minh, độ trễ và chi phí cho hầu hết người dùng.

Cuộc tranh cãi này làm nổi bật bản chất mờ ám của "nền kinh tế token", nơi khách hàng trả tiền cho một đơn vị xử lý AI có vẻ tiêu chuẩn mà không có sự đảm bảo về chất lượng trí tuệ được cung cấp. Trong khi giá token đã giảm khoảng 300 lần trong ba năm, ngân sách AI của doanh nghiệp đang trở nên khó kiểm soát hơn. Một khảo sát từ Mavvrik và Benchmarkit cho thấy 84% doanh nghiệp báo cáo chi phí AI đã làm giảm biên lợi nhuận gộp nhiều hơn dự kiến, với chỉ 15% có thể kiểm soát biến động ngân sách trong vòng 10%. Vấn đề còn phức tạp hơn bởi các yếu tố kỹ thuật như bộ nhớ đệm; một phân tích cho thấy sự thay đổi trong hành vi bộ nhớ đệm của Claude Code có thể làm tăng chi phí đầu vào lên 5,7 lần.

Vấn đề "Lạm phát thu hẹp"

Trọng tâm của cuộc nổi dậy từ phía người dùng là cảm giác họ đang trả cùng một mức giá cho một sản phẩm kém năng lực hơn, một hiện tượng mà một số người gọi là "lạm phát thu hẹp AI" (AI shrinkflation). Vấn đề đã thu hút sự chú ý sau một bài đăng lan truyền trên X từ nhà phát triển Om Patel, tóm tắt sự sụt giảm cảm nhận được là 67% về năng lực, lặp lại những phát hiện từ phân tích GitHub của Laurenzo.

Anthropic đã bác bỏ, cho rằng những thay đổi cảm nhận được là do các lựa chọn về sản phẩm và giao diện, không phải là một sự hạ cấp bí mật. Cherny lưu ý rằng vào ngày 9 tháng 2, Opus 4.6 đã kích hoạt "suy nghĩ thích ứng" theo mặc định và vào ngày 3 tháng 3, mức nỗ lực mặc định đã được đặt thành "trung bình". Trong khi người dùng thiết bị đầu cuối Claude Code có thể đặt mức nỗ lực thành "cao" một cách thủ công, người dùng Pro và Enterprise trên các nền tảng khác thì không thể. Đáp lại sự phản đối, Cherny cho biết công ty sẽ thử nghiệm việc đặt mặc định cho người dùng Teams và Enterprise ở mức "nỗ lực cao".

Câu hỏi về Niềm tin và Tính toán

Cuộc tranh luận diễn ra khi Anthropic trải qua nhu cầu tăng vọt, dẫn đến các giới hạn sử dụng nghiêm ngặt hơn trong giờ cao điểm và thúc đẩy suy đoán rằng công ty có thể đang đối mặt với tình trạng thiếu hụt năng lực tính toán. Giám đốc doanh thu của OpenAI, trong một bản ghi nhớ nội bộ được báo cáo, đã tuyên bố Anthropic đã mắc một "sai lầm chiến lược" khi không đảm bảo đủ năng lực tính toán. Anthropic đã phủ nhận việc họ hạ cấp các mô hình để quản lý nhu cầu.

Tình hình tạo ra một khoảng cách niềm tin nghiêm trọng đối với một công ty vốn tự xây dựng hình ảnh là minh bạch hơn và phù hợp với lợi ích của người dùng hơn các đối thủ. Khi Anthropic cạnh tranh với các dịch vụ như Codex của OpenAI và nhắm đến một đợt IPO tiềm năng, nhận thức rằng họ sẽ âm thầm giảm chất lượng mô hình — ngay cả khi vì lý do cân bằng chi phí — có thể làm tổn hại đến vị thế của họ đối với các nhà phát triển doanh nghiệp, những người đóng vai trò then chốt cho sự tăng trưởng của họ. Thách thức của công ty hiện nay là điều hòa giữa mức giá cố định của một token với giá trị biến đổi của "trí thông minh" mà nó chứa đựng.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.