மெட்டா அதன் சொந்த வழக்கறிஞர்களின் எச்சரிக்கைகளை மீறி AI பயிற்சிக்காக பதிப்புரிமை பெற்ற பொருட்களைப் பயன்படுத்தியதாக ஆசிரியர்கள் கூறுகின்றனர்.
மெட்டா அதன் சொந்த சட்ட ஆலோசகரின் எச்சரிக்கையான ஆலோசனையைப் புறக்கணித்து, AI பயிற்சிக்காக பதிப்புரிமை பெற்ற பொருட்களைப் பயன்படுத்தியதாக ஆசிரியர்கள் கூறுகின்றனர்.

கடந்த கோடையில் முதலில் தாக்கல் செய்யப்பட்ட பதிப்புரிமை மீறல் வழக்கில் சமீபத்தில் தாக்கல் செய்யப்பட்ட தகவலின்படி, Meta Platforms (NASDAQ: META ) இன் ஆலோசகர் ஆயிரக்கணக்கான திருட்டு புத்தகங்களைப் பயன்படுத்தி அதன் AI மாதிரிகளைப் பயிற்றுவிப்பதால் ஏற்படும் சட்ட அபாயங்கள் குறித்து எச்சரித்தார், ஆனால் வணிகம் அதைச் செய்தது.
திங்கள்கிழமை பிற்பகுதியில் செய்யப்பட்ட புதிய தாக்கல், பேஸ்புக் மற்றும் இன்ஸ்டாகிராம் உரிமையாளருக்கு எதிராக நகைச்சுவை நடிகர் சாரா சில்வர்மேன், புலிட்சர் பரிசு வென்ற மைக்கேல் சாபோன் மற்றும் பிற முக்கிய எழுத்தாளர்களால் தாக்கல் செய்யப்பட்ட இரண்டு வழக்குகளை ஒருங்கிணைக்கிறது. -உளவுத்துறை மொழி மாதிரி, லாமா.
கடந்த மாதம், கலிபோர்னியா நீதிமன்றம் சில்வர்மேன் புகாரின் ஒரு பகுதியை நிராகரித்தது மற்றும் எழுத்தாளர்கள் தங்கள் குற்றச்சாட்டுகளை திருத்த சுதந்திரம் வழங்குவதாக பரிந்துரைத்தது.
குற்றச்சாட்டுகள் குறித்த கருத்துக்கான கோரிக்கைக்கு மெட்டா விரைவாக பதிலளிக்கவில்லை.
திங்களன்று தாக்கல் செய்யப்பட்ட புதிய வழக்கு, டிஸ்கார்ட் சேனலில் தரவுத்தொகுப்பின் கொள்முதல் பற்றி விவாதிக்கும் ஒரு மெட்டா-இணைக்கப்பட்ட ஆராய்ச்சியாளர் அரட்டை பதிவுகளை உள்ளடக்கியது, இது புத்தகங்களின் பயன்பாடு அமெரிக்க பதிப்புரிமைக்கு உட்பட்டதாக இருக்காது என்பதை மெட்டா அறிந்திருந்தது என்பதைக் குறிக்கும் முக்கிய ஆதாரமாகும். சட்டம்.
புகாரில் மேற்கோள் காட்டப்பட்ட அரட்டைப் பதிவுகளில், ஆராய்ச்சியாளர் டிம் டெட்மர்ஸ், புத்தகக் கோப்புகளைப் பயிற்சித் தரவாகப் பயன்படுத்துவது "சட்டப்படி சரியா" என்பது குறித்து மெட்டாவின் சட்டத் துறையுடன் முன்னும் பின்னுமாக விளக்குகிறார்.
"ஃபேஸ்புக்கில், நான் உட்பட (T)he (P)ile உடன் பணிபுரிய நிறைய பேர் ஆர்வமாக உள்ளனர், ஆனால் அதன் தற்போதைய வடிவத்தில், சட்ட காரணங்களுக்காக எங்களால் அதைப் பயன்படுத்த முடியவில்லை" என்று 2021 இல் Dettmers எழுதினார். புகாரின்படி, லாமாவின் முதல் பதிப்பைப் பயிற்றுவிக்க மெட்டா ஒப்புக்கொண்ட தரவுத்தொகுப்பு.
புகாரின்படி, "தரவைப் பயன்படுத்த முடியாது அல்லது மாதிரிகளை வெளியிட முடியாது" என்று மெட்டாவின் வழக்கறிஞர்கள் தனக்கு அறிவுறுத்தியதாக டெட்மர்ஸ் ஒரு மாதத்திற்கு முன்பு எழுதினார்.
Dettmers வழக்கறிஞர்களின் கவலைகளை நிவர்த்தி செய்யவில்லை என்றாலும், அவரது அரட்டை சகாக்கள் "செயலில் உள்ள பதிப்புரிமை கொண்ட புத்தகங்கள்" கவலைக்குரிய ஆதாரமாக குறிப்பிடுகின்றனர். தரவுப் பயிற்சியானது "நியாயமான பயன்பாட்டின் கீழ் வர வேண்டும்" என்று அவர்கள் வாதிடுகின்றனர், இது அமெரிக்காவில் உள்ள ஒரு சட்டக் கட்டமைப்பாகும், இது பதிப்புரிமை பெற்ற உள்ளடக்கத்தின் சில உரிமமற்ற பயன்பாடுகளை உள்ளடக்கியது.
வாஷிங்டன் பல்கலைக்கழகத்தில் முனைவர் பட்டம் பெற்ற மாணவர் டெட்மர்ஸ், ராய்ட்டர்ஸிடம் கூறியது, கூற்றுக்கள் குறித்து இப்போதே கருத்து தெரிவிக்க முடியாது.
இந்த ஆண்டு, தொழில்நுட்ப நிறுவனங்கள், உள்ளடக்கத் தயாரிப்பாளர்களிடமிருந்து பல வழக்குகளைத் தாக்கியுள்ளன, அவை உலகளாவிய ரீதியில் பரவலான AI மாதிரிகளை உருவாக்குவதற்காக பதிப்புரிமை-பாதுகாக்கப்பட்ட படைப்புகளைத் திருடுவதாகக் குற்றம் சாட்டின.
வெற்றியடைந்தால், AI நிறுவனங்களை கலைஞர்கள், ஆசிரியர்கள் மற்றும் பிற உள்ளடக்க தயாரிப்பாளர்கள் தங்கள் படைப்புகளின் பயன்பாட்டிற்காக ஈடுசெய்யும்படி கட்டாயப்படுத்துவதன் மூலம், இந்த வழக்குகள் உருவாக்கும் AI வெறியைக் குறைக்கலாம், தரவு-பசியுள்ள மாதிரிகளை உருவாக்குவதற்கான செலவை அதிகரிக்கும்.
அதேசமயம், ஐரோப்பாவில் செயற்கை நுண்ணறிவைக் கட்டுப்படுத்தும் புதிய தற்காலிக விதிகள், பெருநிறுவனங்கள் தங்கள் மாதிரிகளைப் பயிற்றுவிக்கப் பயன்படுத்தும் தரவை வெளிப்படுத்தக் கட்டாயப்படுத்தலாம், மேலும் அவை கூடுதல் சட்ட ஆபத்தில் இருக்கக்கூடும்.
பிப்ரவரியில், மெட்டா அவர்களின் லாமா பெரிய மொழி மாதிரியின் ஆரம்ப பதிப்பை வெளியிட்டது மற்றும் பயிற்சிக்காக பயன்படுத்தப்படும் தரவுத்தொகுப்புகளின் பட்டியலை வெளியிட்டது, அதில் "ThePile இன் Books3 பிரிவு" அடங்கும். புகாரின்படி, தரவுத்தொகுப்பைத் தொகுத்தவர், அதில் 196,640 புத்தகங்கள் உள்ளதாக வேறு இடத்தில் கூறியுள்ளார்.
இந்த கோடையில் வணிக ரீதியாகக் கிடைக்கப்பெற்ற மாடலின் மிக சமீபத்திய பதிப்பான லாமா 2 க்கான பயிற்சித் தரவை நிறுவனம் வெளியிடவில்லை.
700 மில்லியனுக்கும் குறைவான மாதாந்திர செயலில் உள்ள பயனர்களைக் கொண்ட வணிகங்களுக்கு, Llama 2 இலவசம். அதன் அறிமுகமானது, உருவாக்கப்படும் AI மென்பொருளுக்கான சந்தையில் சாத்தியமான கேம்-சேஞ்சராக பார்க்கப்பட்டது, இது OpenAI மற்றும் Google (NASDAQ: GOOGL ) போன்ற போட்டியாளர்களின் ஆதிக்கத்தை அச்சுறுத்துகிறது, இது அவர்களின் மாடல்களின் பயன்பாட்டிற்கு கட்டணம் வசூலிக்கிறது.
முதலீட்டாளர்கள் டிரேடிங் உலகில் வளர உதவ போனஸ் சலுகை!