Các tác giả cho rằng Meta đã khai thác các tài liệu có bản quyền để đào tạo AI bất chấp cảnh báo từ luật sư của chính họ
Các tác giả cho rằng Meta đã sử dụng các tài liệu có bản quyền để đào tạo AI, bất chấp lời khuyên cảnh báo từ luật sư riêng của mình.

Theo một hồ sơ gần đây trong vụ kiện vi phạm bản quyền được đệ trình lần đầu vào mùa hè năm ngoái, luật sư của Meta Platforms (NASDAQ: META ) đã cảnh báo về những rủi ro pháp lý khi sử dụng hàng nghìn cuốn sách vi phạm bản quyền để đào tạo các mô hình AI của mình, nhưng doanh nghiệp này vẫn làm như vậy.
Hồ sơ mới, được thực hiện vào tối thứ Hai, kết hợp hai vụ kiện chống lại chủ sở hữu Facebook và Instagram của diễn viên hài Sarah Silverman, người đoạt giải Pulitzer Michael Chabon và các tác giả nổi tiếng khác, những người cho rằng Meta đã sử dụng tác phẩm của họ mà không được phép để đào tạo nhân tạo của nó. -Mô hình ngôn ngữ trí tuệ, Llama.
Tháng trước, một tòa án ở California đã bác bỏ một phần đơn khiếu nại của Silverman và đề nghị rằng ông sẽ cho phép các nhà văn tự do sửa đổi các cáo buộc của họ.
Meta đã không phản ứng nhanh chóng trước yêu cầu bình luận về các cáo buộc.
Vụ việc mới, được đệ trình vào thứ Hai, bao gồm nhật ký trò chuyện của một nhà nghiên cứu liên kết với Meta thảo luận về việc mua tập dữ liệu trong kênh Discord, một bằng chứng quan trọng cho thấy Meta biết rằng việc sử dụng sách của họ có thể không được bảo vệ bởi bản quyền của Hoa Kỳ. pháp luật.
Trong nhật ký trò chuyện được trích dẫn trong đơn khiếu nại, nhà nghiên cứu Tim Dettmers giải thích việc qua lại với bộ phận pháp lý của Meta về việc liệu việc sử dụng tệp sách làm dữ liệu đào tạo có “được về mặt pháp lý” hay không.
“Tại Facebook, có rất nhiều người muốn làm việc với (T)he (P)ile, bao gồm cả tôi, nhưng với hình thức hiện tại, chúng tôi không thể sử dụng nó vì lý do pháp lý”, Dettmers viết vào năm 2021, đề cập đến Theo đơn khiếu nại, một tập dữ liệu mà Meta thừa nhận đã sử dụng để đào tạo phiên bản đầu tiên của Llama.
Dettmers đã viết một tháng trước đó rằng các luật sư của Meta đã khuyên anh ta rằng “không thể sử dụng dữ liệu hoặc không thể xuất bản các mô hình nếu họ được đào tạo về dữ liệu đó”, theo đơn khiếu nại.
Trong khi Dettmers không giải quyết những lo ngại của các luật sư, thì các đồng nghiệp trò chuyện của ông đề cập đến "những cuốn sách có bản quyền còn hiệu lực" là nguồn gây lo ngại nhất. Họ lập luận rằng việc đào tạo dữ liệu phải "thuộc phạm vi sử dụng hợp pháp", một khuôn khổ pháp lý ở Hoa Kỳ bao gồm một số trường hợp sử dụng tài liệu có bản quyền mà không được cấp phép.
Dettmers, một nghiên cứu sinh tiến sĩ tại Đại học Washington, nói với Reuters rằng ông không thể bình luận ngay về những tuyên bố này.
Năm nay, các công ty công nghệ đã phải hứng chịu một loạt vụ kiện từ các nhà sản xuất nội dung cáo buộc họ ăn cắp các tác phẩm được bảo vệ bản quyền để xây dựng các mô hình AI có tính sáng tạo đã trở thành hiện tượng toàn cầu và gây ra làn sóng đầu tư điên cuồng.
Nếu thành công, các vụ kiện có thể làm giảm cơn sốt AI đang phát triển bằng cách buộc các công ty AI phải bồi thường cho các nghệ sĩ, tác giả và nhà sản xuất nội dung khác về việc sử dụng tác phẩm của họ, làm tăng chi phí xây dựng các mô hình ngốn dữ liệu.
Đồng thời, các quy tắc tạm thời mới quản lý trí tuệ nhân tạo ở châu Âu có thể buộc các tập đoàn tiết lộ dữ liệu họ sử dụng để đào tạo mô hình của mình, có thể khiến họ gặp thêm nguy hiểm về mặt pháp lý.
Vào tháng 2, Meta đã công bố phiên bản đầu tiên của mô hình ngôn ngữ lớn Llama của họ và tiết lộ danh sách các bộ dữ liệu được sử dụng để đào tạo, bao gồm “phần Books3 của ThePile”. Theo đơn khiếu nại, người biên soạn tập dữ liệu đã tuyên bố ở nơi khác rằng nó bao gồm 196.640 cuốn sách.
Công ty đã không công bố dữ liệu đào tạo cho phiên bản mới nhất của mô hình, Llama 2, phiên bản thương mại hóa vào mùa hè này.
Đối với các doanh nghiệp có ít hơn 700 triệu người dùng hoạt động hàng tháng, Llama 2 được sử dụng miễn phí. Sự ra đời của nó được coi là một yếu tố thay đổi cuộc chơi tiềm năng trên thị trường phần mềm AI tổng hợp, đe dọa sự thống trị của các đối thủ cạnh tranh như OpenAI và Google (NASDAQ: GOOGL ), vốn tính phí sử dụng mô hình của họ.
Giúp nhà đầu tư kiếm tiền trong thị trường giao dịch với cơ chế hoàn tiền thường.