Penulis mengklaim bahwa Meta mengeksploitasi materi berhak cipta untuk pelatihan AI meskipun ada peringatan dari pengacaranya sendiri
Penulis mengklaim bahwa Meta menggunakan materi berhak cipta untuk pelatihan AI, mengabaikan nasihat peringatan dari penasihat hukumnya sendiri.

Berdasarkan pengajuan baru-baru ini dalam kasus pelanggaran hak cipta yang diajukan pada musim panas lalu, pengacara Meta Platforms (NASDAQ: META ) memperingatkan perusahaan tersebut mengenai risiko hukum dari penggunaan ribuan buku bajakan untuk melatih model AI-nya, namun perusahaan tersebut tetap melakukannya.
Pengajuan baru, yang dibuat Senin malam, menggabungkan dua tuntutan hukum yang diajukan terhadap pemilik Facebook dan Instagram oleh komedian Sarah Silverman, pemenang Hadiah Pulitzer Michael Chabon, dan penulis terkemuka lainnya, yang mengklaim bahwa Meta menggunakan karya mereka tanpa izin untuk melatih buatannya. -model bahasa intelijen, Llama.
Bulan lalu, pengadilan California menolak sebagian dari pengaduan Silverman dan menyarankan agar dia memberikan kebebasan kepada penulis untuk mengubah tuduhan mereka.
Meta tidak bereaksi cepat terhadap permintaan komentar atas tuduhan tersebut.
Kasus baru, yang diajukan pada hari Senin, mencakup log obrolan dari peneliti yang berafiliasi dengan Meta yang mendiskusikan pengadaan kumpulan data di saluran Discord, sebuah bukti penting yang menunjukkan bahwa Meta menyadari bahwa penggunaan buku tersebut mungkin tidak tercakup dalam hak cipta AS. hukum.
Dalam log obrolan yang dikutip dalam pengaduan, peneliti Tim Dettmers menjelaskan bolak-balik dengan departemen hukum Meta mengenai apakah menggunakan file buku sebagai data pelatihan "boleh secara hukum".
“Di Facebook, ada banyak orang yang tertarik bekerja dengan (T)he (P)ile, termasuk saya, namun dalam bentuknya saat ini, kami tidak dapat menggunakannya karena alasan hukum,” tulis Dettmers pada tahun 2021, merujuk pada kumpulan data yang diakui Meta digunakan untuk melatih Llama versi pertamanya, menurut pengaduan.
Dettmers menulis sebulan sebelumnya bahwa pengacara Meta telah menasihatinya bahwa "data tidak dapat digunakan atau model tidak dapat dipublikasikan jika mereka dilatih tentang data tersebut," menurut pengaduan tersebut.
Meskipun Dettmers tidak menjawab kekhawatiran para pengacara tersebut, rekan obrolannya menyebutkan "buku dengan hak cipta aktif" sebagai sumber kekhawatiran yang paling mungkin. Mereka berpendapat bahwa pelatihan data harus “termasuk dalam penggunaan wajar,” sebuah kerangka hukum di Amerika Serikat yang mencakup penggunaan materi berhak cipta tertentu tanpa izin.
Dettmers, seorang mahasiswa doktoral di Universitas Washington, mengatakan kepada Reuters bahwa dia tidak bisa langsung mengomentari klaim tersebut.
Tahun ini, perusahaan teknologi dilanda serangkaian tuntutan hukum dari produsen konten yang menuduh mereka mencuri karya yang dilindungi hak cipta untuk membangun model AI generatif yang telah menjadi sensasi global dan memicu kegilaan investasi.
Jika kasus ini berhasil, kasus ini mungkin dapat meredam kegilaan generatif AI dengan memaksa perusahaan AI memberikan kompensasi kepada seniman, penulis, dan produser konten lainnya atas penggunaan karya mereka, sehingga meningkatkan biaya pembuatan model yang membutuhkan data.
Pada saat yang sama, peraturan sementara baru yang mengatur kecerdasan buatan di Eropa dapat mewajibkan perusahaan untuk mengungkapkan data yang mereka gunakan untuk melatih model mereka, yang mungkin akan membuat mereka menghadapi bahaya hukum tambahan.
Pada bulan Februari, Meta meluncurkan versi awal model bahasa besar Llama mereka dan mengungkapkan daftar kumpulan data yang digunakan untuk pelatihan, termasuk "bagian Books3 dari ThePile". Berdasarkan pengaduan tersebut, orang yang menyusun kumpulan data tersebut menyatakan di tempat lain bahwa kumpulan data tersebut terdiri dari 196.640 buku.
Perusahaan tidak merilis data pelatihan untuk model versi terbarunya, Llama 2, yang tersedia secara komersial musim panas ini.
Untuk bisnis dengan kurang dari 700 juta pengguna aktif bulanan, Llama 2 gratis untuk digunakan. Pengenalannya dipandang sebagai terobosan potensial di pasar perangkat lunak AI generatif, mengancam dominasi pesaing seperti OpenAI dan Google (NASDAQ: GOOGL ), yang mengenakan biaya atas penggunaan model mereka.
Bonus rabat untuk membantu investor berkembang di dunia trading!