Một liên minh gồm gần 400 tờ báo địa phương và khu vực đã kiện OpenAI và Microsoft vào thứ Tư, cáo buộc các công ty này đã thu thập một cách có hệ thống các bài báo có bản quyền để huấn luyện ChatGPT và Copilot mà không được phép hoặc trả tiền.
Một liên minh gồm gần 400 tờ báo đã kiện OpenAI và Microsoft vì đã thu thập một cách có hệ thống các bài báo có bản quyền để huấn luyện ChatGPT và Microsoft Copilot, cáo buộc hành vi này đe dọa sự tồn tại của báo chí địa phương.
"Tác phẩm báo chí của các nhà xuất bản là yếu tố thiết yếu cho sự tăng trưởng bùng nổ của các bị đơn, và trừ khi các bị đơn phải chịu trách nhiệm về hành vi đánh cắp, lột bỏ và lạm dụng nội dung của các nhà xuất bản, thì cơn sốt AI sẽ là hồi chuông báo tử cho báo chí địa phương," các nhà xuất bản nói trong đơn kiện nộp lên Tòa án Quận phía Nam New York.
Vụ kiện do Richner Communications có trụ sở tại Long Island khởi xướng và được đại diện bởi cựu Tổng chưởng lý New Jersey Matthew Platkin, cáo buộc OpenAI và Microsoft đã sao chép hàng trăm nghìn bài báo — bao gồm cả nội dung sau tường phí — lên máy chủ của họ, tước bỏ thông tin quản lý bản quyền như tên tác giả và tên ấn phẩm, đồng thời sử dụng tài liệu này để huấn luyện các mô hình ngôn ngữ lớn có thể tái tạo lại tác phẩm khi người dùng yêu cầu.
Vụ việc này bổ sung vào làn sóng kiện tụng bản quyền ngày càng gia tăng nhắm vào các nhà phát triển AI, bao gồm các vụ kiện của New York Times, CNN, Reddit và Merriam-Webster chống lại Perplexity AI, cũng như một vụ kiện riêng của Encyclopedia Britannica và Merriam-Webster chống lại OpenAI. OpenAI, được định giá 852 tỷ USD sau vòng gọi vốn 122 tỷ USD vào tháng 3, cho biết các mô hình của họ "dựa trên nguyên tắc sử dụng hợp pháp."
Quy mô của các cáo buộc
Các nhà xuất bản cáo buộc các bị đơn đã "thu thập một cách có hệ thống và bí mật" các trang web của họ, sao chép các tác phẩm gốc lên máy chủ của riêng họ, đồng thời tước bỏ thông tin quản lý bản quyền. Đơn kiện yêu cầu bồi thường theo luật định và biện pháp khẩn cấp đối với hành vi vi phạm bản quyền và vi phạm Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số.
Microsoft, công ty đã đầu tư 1 tỷ USD ban đầu vào OpenAI vào năm 2019, được mô tả trong đơn kiện là "đối tác không thể thiếu trong hầu hết mọi khía cạnh của hoạt động thương mại của OpenAI." Các nhà xuất bản lập luận rằng các sản phẩm AI tạo sinh được xây dựng từ nội dung của họ đã tạo ra hàng tỷ USD giá trị thị trường cho các bị đơn, mà không có "một xu nào" trong số đó đến với những người sáng tạo nội dung.
Những gì đang bị đe dọa đối với ngành AI
Vụ kiện này đại diện cho nỗ lực pháp lý lớn nhất do các tờ báo địa phương và khu vực dẫn đầu trong cuộc chiến về dữ liệu huấn luyện AI. Các vụ kiện trước đây, bao gồm vụ kiện của New York Times chống lại OpenAI, tập trung vào các tổ chức tin tức quốc gia, khiến báo chí địa phương phần lớn vắng mặt trong cuộc tranh luận.
"Báo chí địa phương là nguồn tin đáng tin cậy đối với đại đa số người Mỹ," Platkin nói trong một cuộc phỏng vấn. "Đó là huyết mạch của nền dân chủ của chúng ta, và mô hình kinh doanh này thực sự đã đặt báo chí địa phương vào nguy cơ tuyệt chủng."
Kết quả có thể định hình lại cách các công ty AI khai thác dữ liệu huấn luyện. Nếu tòa án bác bỏ lập luận sử dụng hợp pháp của OpenAI, ngành công nghiệp này có thể phải đối mặt với hàng tỷ USD chi phí cấp phép hồi tố và buộc phải đàm phán các thỏa thuận nội dung với hàng nghìn nhà xuất bản. OpenAI đã ký các thỏa thuận cấp phép với một số hãng tin bao gồm Associated Press và Axel Springer, nhưng liên minh các nhà xuất bản địa phương cho rằng các thỏa thuận đó không bao phủ phần lớn các tòa soạn báo.
Người phát ngôn của OpenAI, Drew Pusateri, cho biết trong một tuyên bố rằng các mô hình của công ty "trao quyền cho sự đổi mới, được huấn luyện trên dữ liệu công khai và dựa trên nguyên tắc sử dụng hợp pháp." Microsoft chưa đưa ra phản hồi ngay lập tức cho yêu cầu bình luận.
Vụ án là Richner Commc'ns, Inc. kiện Microsoft Corp., Số 1:26-cv-05320, tại Tòa án Quận phía Nam New York.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.