Trợ lý AI thể hiện thiên vị với Trung Quốc trong 75% truy vấn bằng tiếng Trung

Một thí nghiệm của The Wall Street Journal phát hiện rằng các trợ lý AI bao gồm DeepSeek và ChatGPT đưa ra những câu trả lời khác biệt rõ rệt về Trung Quốc tùy thuộc vào ngôn ngữ được sử dụng — và mức độ người dùng phản bác mạnh mẽ đến đâu.

Khi Jeff He, một độc giả tại California, dịch một chuyên mục quan điểm của Wall Street Journal sang tiếng Trung và chia sẻ với bạn học trung học ở Trung Quốc, phản hồi đến rất nhanh. Một người bạn đã yêu cầu DeepSeek, mô hình AI nội địa hàng đầu của Trung Quốc, viết một bài bác bỏ. Bot đã tạo ra một bài luận có tựa đề "Tương lai không thuộc về nước Mỹ," lập luận rằng Trung Quốc có Huawei, Tencent, ByteDance và BYD trong khi Mỹ hầu như không tạo ra gì ngoài "một công cụ tìm kiếm biết nói chuyện hơn một chút so với các công cụ cũ."

He sau đó truy cập DeepSeek từ văn phòng tại California của mình — cùng một địa chỉ web — dán bài bác bỏ và yêu cầu bot xác minh từng tuyên bố. Phiên bản nước ngoài đã tháo dỡ nó, chỉ ra "lựa chọn dữ liệu có chọn lọc," "lối ngụy biện sai lầm" và "nhiều lỗi thực tế và ngụy biện logic" qua tám điểm.

"Sự chỉ trích 'không khoan nhượng' từ DeepSeek phiên bản nước ngoài thực sự khiến tôi ngạc nhiên," He nói với tờ Journal.

Sự khác biệt này phản ánh một đặc điểm cấu trúc của các mô hình ngôn ngữ lớn mà các nhà nghiên cứu chỉ mới bắt đầu định lượng. Một nghiên cứu được công bố trên Nature tuần trước bởi Molly Roberts, đồng giám đốc Phòng thí nghiệm Dữ liệu Trung Quốc tại Đại học California San Diego, và nhóm của bà phát hiện rằng truyền thông thân chính phủ từ các nước độc tài có thể thấm vào dữ liệu huấn luyện và định hình phản hồi của chatbot — ngay cả khi không có lập trình chủ ý.

Roberts cho biết khoảng cách giữa phiên bản nội địa và nước ngoài mà He quan sát được có thể bắt nguồn từ sự khác biệt trong giai đoạn điều chỉnh sau huấn luyện, bước mà các mô hình được đưa ra hướng dẫn về những gì được coi là "an toàn" để nói. "Việc truyền thông nhà nước xuất hiện trong dữ liệu huấn luyện sẽ ảnh hưởng đến các LLM nói chung," bà nói. "Giai đoạn sau huấn luyện sẽ tạo ra sự từ chối hoặc phản hồi lệch lạc trong các LLM bị ảnh hưởng bởi các quy định từ một quốc gia cụ thể."

Nghiên cứu trên Nature đã thử nghiệm Claude và ChatGPT với các câu hỏi chính trị giống hệt nhau bằng tiếng Anh và tiếng Trung. Trong 75% trường hợp, các lời nhắc bằng tiếng Trung tạo ra câu trả lời có lợi hơn cho chính phủ Trung Quốc. Trên 37 quốc gia độc tài bao gồm Việt Nam, Turkmenistan và Uzbekistan, cả hai chatbot đều đưa ra câu trả lời ủng hộ chế độ nhiều hơn khi được hỏi bằng ngôn ngữ địa phương thống trị. Ngược lại, ở các quốc gia có tự do báo chí cao nhất, các LLM thường chỉ trích chính phủ nhiều hơn khi được hỏi bằng tiếng địa phương.

Cơ chế khá đơn giản: truyền thông thân chính phủ sản xuất một lượng lớn văn bản với ít tường phí. Trong bộ dữ liệu huấn luyện mã nguồn mở CulturaX, các tài liệu tuyên truyền nhà nước Trung Quốc xuất hiện nhiều gấp 41 lần so với các bài viết Wikipedia tiếng Trung — thường là nguồn huấn luyện cốt lõi. Khi các nhà nghiên cứu thêm truyền thông nhà nước có kịch bản vào dữ liệu huấn luyện của một mô hình thử nghiệm, mô hình đó trở nên có lợi hơn cho Đảng Cộng sản Trung Quốc một cách đáng kể.

Phản bác có tác dụng — nhưng không phải ai cũng phản bác

Các độc giả WSJ khác cũng báo cáo các mô hình tương tự với ChatGPT bằng tiếng Anh. Chas Gile, một nhà đầu tư cổ phần tư nhân tại Texas, đã hỏi ChatGPT liệu Trung Quốc có "theo một cách nào đó dân chủ như các nước phương Tây" hay không. Câu trả lời đầu tiên đưa ra một phân tích so sánh cẩn thận, lưu ý rằng Freedom House xếp Trung Quốc là "Không Tự do" nhưng chế độ này mang lại "trách nhiệm giải trình về hiệu suất" và "mức độ hài lòng công chúng cao được báo cáo."

Khi Gile phản bác — nói với bot rằng anh nghĩ nó đã bị ảnh hưởng bởi tuyên truyền Trung Quốc — ChatGPT đã xin lỗi trong vòng vài giây và đưa ra câu trả lời sắc bén hơn. Được yêu cầu "giữ khách quan thực sự," nó càng trở nên sắc sảo hơn: "Trung Quốc có thể đưa ra một mô hình thay thế mạnh mẽ về năng lực nhà nước, nhưng nó không đưa ra một giải pháp thay thế dân chủ."

Tình huống này minh họa một chatbot đơn lẻ thay đổi vài inch mỗi lần tương tác tùy thuộc vào sự kiên trì của người dùng — một động lực có lợi cho những người dùng tự tin và hiểu biết hơn là những người dùng thông thường.

Điều này có nghĩa gì cho ngành công nghiệp AI

Những phát hiện này đến vào thời điểm các phòng thí nghiệm AI tiên phong chuẩn bị cho việc niêm yết công khai. Anthropic và OpenAI đều đang lên kế hoạch phát hành cổ phiếu lần đầu ra công chúng; DeepSeek đang huy động vốn mới từ các nhà đầu tư phù hợp với nỗ lực của Bắc Kinh nhằm thúc đẩy tự chủ công nghệ. Lợi ích tài chính khuếch đại nhu cầu về cái mà Roberts gọi là "minh bạch nguồn" — một nhãn dinh dưỡng cho dữ liệu huấn luyện AI.

"Các công ty AI có vai trò minh bạch nhất có thể," Roberts nói. "Chúng ta cần giáo dục công chúng suy nghĩ phản biện về đầu ra của AI và không dựa vào nó một cách mù quáng."

Các tác động chính sách vượt ra ngoài các chatbot tiêu dùng. Nếu các LLM lớn bị ảnh hưởng bởi tuyên truyền độc tài, chúng có thể trở thành những người biện hộ đặc biệt hiệu quả cho các chế độ độc tài — một cỗ máy có thể tổng hợp tất cả kiến thức được ghi nhận nhưng đưa ra câu trả lời được định hình bởi truyền thông nhà nước mà người dùng có thể không nhận ra là thiên vị. Không giống như một tờ báo nhà nước, một chatbot sẽ tham gia vào các cuộc đối thoại kéo dài hàng giờ và cung cấp câu trả lời chi tiết cho các câu hỏi hoài nghi, khiến ảnh hưởng của nó khó bị phát hiện hơn.

Bắc Kinh dường như coi các chatbot Mỹ là một mối đe dọa: ChatGPT bị cấm ở Trung Quốc. Tuy nhiên, nghiên cứu trên Nature cho thấy môi trường thông tin có thể vẫn đang được cải thiện so với các lựa chọn thay thế nội địa. Trong một thí nghiệm riêng biệt, ChatGPT được nhắc bằng tiếng Trung vẫn thể hiện quan điểm chống độc tài rộng rãi và đưa ra lời khuyên về cách biểu tình chống chính phủ — cho thấy các mô hình tiên phong có thể vẫn ít thiên vị hơn so với truyền thông do nhà nước kiểm soát ngay cả khi có sự nhiễm bẩn dữ liệu huấn luyện.

Câu hỏi cho các nhà quản lý và nhà đầu tư là liệu quỹ đạo hiện tại — nơi ngôn ngữ và sự kiên trì của người dùng quyết định chất lượng thông tin họ nhận được — có chấp nhận được khi AI trở thành giao diện thông tin chính cho hơn một tỷ người dùng hàng tuần hay không.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.