Một nhóm các nhà xuất bản và tác giả lớn cáo buộc Meta đã vi phạm bản quyền hàng triệu cuốn sách để đào tạo AI Llama, làm gia tăng các cuộc chiến pháp lý mà ngành công nghiệp AI trị giá hàng tỷ đô la đang phải đối mặt.
Quay lại
Một nhóm các nhà xuất bản và tác giả lớn cáo buộc Meta đã vi phạm bản quyền hàng triệu cuốn sách để đào tạo AI Llama, làm gia tăng các cuộc chiến pháp lý mà ngành công nghiệp AI trị giá hàng tỷ đô la đang phải đối mặt.

Năm nhà xuất bản lớn và tiểu thuyết gia bán chạy nhất Scott Turow đã nộp đơn kiện tập thể chống lại Meta Platforms Inc., cáo buộc công ty này vi phạm bản quyền quy mô lớn để xây dựng các mô hình trí tuệ nhân tạo Llama của mình. Đơn khiếu nại, được nộp tại tòa án liên bang Manhattan, lập luận rằng tham vọng AI trị giá hàng tỷ đô la của Meta được xây dựng trên nền tảng là các cuốn sách và bài báo lậu, gây ra mối đe dọa trực tiếp đối với khoản đầu tư khổng lồ của công ty vào công nghệ này.
"Sự vi phạm quy mô lớn của Meta không phải là sự tiến bộ công cộng, và AI sẽ không bao giờ được hiện thực hóa đúng cách nếu các công ty công nghệ ưu tiên các trang web lậu hơn là học thuật và trí tưởng tượng," Maria Pallante, chủ tịch Hiệp hội các nhà xuất bản Hoa Kỳ, cho biết trong một tuyên bố.
Vụ kiện cáo buộc rằng các kỹ sư của Meta đã sử dụng các kho lưu trữ như Anna’s Archive — một công cụ tìm kiếm nội dung lậu — để có được các tác phẩm không có bản quyền nhằm đào tạo Llama. Các nguyên đơn, bao gồm Hachette, Macmillan và McGraw Hill, tuyên bố hàng triệu tác phẩm có bản quyền đã được sử dụng, từ sách giáo khoa đến các tiểu thuyết như "The Fifth Season" của N.K. Jemisin. Meta đã bác bỏ các cáo buộc, tuyên bố rằng việc đào tạo AI trên tài liệu có bản quyền có thể được coi là sử dụng hợp pháp và họ sẽ "chống lại vụ kiện này một cách quyết liệt."
Thử thách pháp lý này diễn ra khi Meta đang tăng mạnh cam kết tài chính cho AI, với chi phí vốn dự kiến cả năm từ 125 tỷ USD đến 145 tỷ USD. Vụ kiện đòi bồi thường thiệt hại bằng tiền chưa được xác định, nhưng các vụ kiện tương tự làm nổi bật khả năng bị phạt tài chính nặng nề. Trong một vụ kiện riêng biệt chống lại Databricks, một luật sư về bản quyền lưu ý rằng thiệt hại tiềm tàng có thể là "phi thường", lên tới 150.000 USD cho mỗi tác phẩm bị vi phạm, một con số có thể "thanh lý mọi tài sản" của một công ty.
Vụ kiện chống lại Meta là vụ mới nhất trong một loạt các trận chiến pháp lý có tính rủi ro cao giữa các công ty công nghệ và những người nắm giữ bản quyền về dữ liệu được sử dụng để đào tạo các mô hình ngôn ngữ lớn. Các công ty bao gồm OpenAI, Anthropic và Databricks đều phải đối mặt với các cáo buộc vi phạm tương tự từ các tác giả, nghệ sĩ và tổ chức tin tức, tạo ra một bối cảnh pháp lý phức tạp và không chắc chắn cho ngành công nghiệp AI đang phát triển.
Các tòa án vẫn chưa hình thành sự đồng thuận về việc liệu sử dụng các tác phẩm có bản quyền để đào tạo AI có cấu thành việc "sử dụng hợp pháp" hay không. Tuy nhiên, các rủi ro tài chính đang trở nên rõ ràng hơn. Anthropic, được Amazon và Google hậu thuẫn, gần đây đã đồng ý thành lập một quỹ trị giá 1,5 tỷ USD để bồi thường cho các tác giả trong một thỏa thuận nhằm giải quyết một vụ kiện tập thể về vi phạm bản quyền, đánh dấu một trong những thỏa thuận lớn đầu tiên thuộc loại này. Điều này tạo ra một tiền lệ tốn kém cho Meta khi công ty này đang phải đối mặt với cuộc chiến pháp lý của riêng mình.
Vụ kiện trực tiếp nhắm vào cốt lõi của chiến lược hiện tại của Meta, liên quan đến việc chi hàng trăm tỷ đô la cho cơ sở hạ tầng AI. Công ty gần đây đã khởi động đợt bán trái phiếu trị giá lên tới 25 tỷ USD để giúp tài trợ cho những nỗ lực này, ngay cả khi các nhà đầu tư tỏ ra lo ngại về việc thiếu một lộ trình thương mại hóa rõ ràng. Giám đốc điều hành Mark Zuckerberg đã thừa nhận rằng ông không có một "kế hoạch rất chính xác" để mở rộng quy mô các sản phẩm AI, một tuyên bố đã góp phần khiến giá cổ phiếu của công ty giảm 10% sau cuộc gọi báo cáo doanh thu gần nhất.
Nếu các tòa án phán quyết chống lại Meta, công ty có thể bị buộc phải trả hàng tỷ đô la tiền bồi thường thiệt hại và quan trọng hơn, có thể phải đào tạo lại các mô hình Llama của mình mà không có dữ liệu tranh chấp. Điều này sẽ đại diện cho một bước lùi đáng kể đối với vị thế cạnh tranh của họ so với các đối thủ như OpenAI và Google và có thể làm vô hiệu hóa một phần đáng kể chi phí vốn khổng lồ của họ cho AI. Vụ kiện làm nổi bật sự căng thẳng ngày càng tăng giữa nỗ lực thúc đẩy phát triển AI nhanh chóng của ngành công nghệ và các khuôn khổ pháp lý và đạo đức bảo vệ sở hữu trí tuệ.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.