Iz OpenAI potvrdili da su uništili više knjiga koje su korištene kao baza za GPT: Evo zašto

Radiosarajevo.ba

Usred tekućeg pravnog sukoba između američkog Ceha autora i OpenAI-ja, pojavili su se nedavno otpečaćeni dokumenti koji rasvjetljavaju brisanje dvaju značajnih skupova podataka, nazvanih "books1" i "books2", ključnih u obuci OpenAI-jevog GPT-3 AI modela.

Pravni podnesci od strane savjetnika Ceha sugeriraju da su ovi skupovi podataka vjerovatno sadržavali više od 100.000 objavljenih knjiga, čineći srž optužbi Ceha da je OpenAI prekršio materijale zaštićene autorskim pravima u razvoju svojih AI modela.

U početku nailazeći na otpor, OpenAI je na kraju popustio, otkrivajući brisanje svih kopija podataka i navodeći njihovu neupotrebu nakon upornih upita Ceha u vezi s tim podacima.

Trending

Mundijal 2026 | Hrvatska pobjedom potvrdila nokaut fazu, dalje ide i Gana

Srednje mjesto u stvaranju moćnih AI modela su visokokvalitetni podaci o obuci. Čelnici AI industrije, uključujući OpenAI, iskoristili su ogromne količine internetskih podataka, uključujući opsežan sadržaj knjiga, kako bi potaknuli razvoj ovih modela, što je izazvalo sporne pravne sporove s autorima koji traže naknadu za svoje doprinose.

Ključna takozvana bijela knjiga OPANAi-ja iz 2020. godine opisala je "books1" i "books2" kao korpuse knjiga temeljene na internetu, koje su pridonijele sa značajnih 16 posto u podacima o obuci GPT-3 modela, što ukupno iznosi nevjerojatnih 67 milijardi tokena, što je pak ekvivalentno otprilike 50 milijardi riječi.

Objave pravnih predstavnika OpenAI-ja otkrile su da je korištenje tih skupova podataka prestalo krajem 2021. godine, s njihovim konačnim brisanjem sredinom 2022. godine zbog neuporabe. Bez obzira na to, ostali podaci o obuci ostaju neoštećeni i dostupni pravnom timu Ceha.

Daljnja otkrića iz nezapečaćenih dokumenata razotkrila su odlazak dvojice istraživača odgovornih za stvaranje skupova podataka iz OpenAI-jevog rada. U početku obavijen velom tajne, OpenAI je na kraju otkrio njihov identitet odvjetnicima Ceha. Međutim, startup se suzdržao od objavljivanja njihovih imena, tražeći od suda da zadrži njihovu anonimnost uz uskraćivanje detaljnih informacija o skupovima podataka.

U pokušaju da pojasni svoje viđenje, OpenAI je ustvrdio da njegovi trenutni ChatGPT i API modeli nisu razvijeni korištenjem spornih skupova podataka. Umjesto toga, skupovi podataka posljednji su put korišteni 2021. godine i naknadno izbrisani 2022. godine zbog produžene neaktivnosti, piše Business Insider.

Dodajte Radiosarajevo.ba u omiljene Google izvore

Radiosarajevo.ba pratite putem aplikacije za Android | iOS i društvenih mreža Twitter | Facebook | Instagram, kao i putem našeg Viber Chata.

umjetna inteligencija chatGPT tehnologija

/ Najčitanije

/ Tech i Prije oko 11h

/ Komentari

Prikaži komentare (1)

/ Povezano

07.05.24. 07:38

/ Najnovije

/ Tech i Prije oko 9h

Iz OpenAI potvrdili da su uništili više knjiga koje su korištene kao baza za GPT: Evo zašto

Mundijal 2026 | Hrvatska pobjedom potvrdila nokaut fazu, dalje ide i Gana

/ Najčitanije

Pećina s kostima drevnih ljudi, koja je posvađala naučnike, upravo je postala još misterioznija

Odlične vijesti za korisnike: ChatGPT je dostupan na Viberu

Kriza u gaming svijetu: Microsoft podiže cijene Xbox konzola

/ Komentari

/ Povezano

Umjetna inteligencija ide korak dalje: 'Sada će biti moguće razgovarati sa preminulim ljudima?'

Nećete vjerovati za šta se sada koristi umjetna inteligencija: Amerikanci ostali u šoku

Upoznajte Nitkolinu, prvu političarku u regiji koju je kreirala umjetna inteligencija

/ Najnovije

Kriza u gaming svijetu: Microsoft podiže cijene Xbox konzola

Pećina s kostima drevnih ljudi, koja je posvađala naučnike, upravo je postala još misterioznija

Odlične vijesti za korisnike: ChatGPT je dostupan na Viberu

Rockstar objavio koliko će koštati GTA VI: Ovo su cijene najiščekivanije igre u historiji gaminga

/ Pročitajte još

Poznati meteorolog objavio prognozu za juli: Stiže osvježenje, a onda novi toplotni talas

Vrijeme je da uzvratimo: Građani pokrenuli akciju podrške crkvi koja je zvonila na golove Zmajeva

Nakon što je Konaković tražio zabranu: Otkazan nastup Jelene Karleuše u Sarajevu

Došlo je do kvara na nekoliko pumpnih agregata: Veliki dio Sarajeva večeras ostaje bez vode

Podijeli članak