Zastrašujuće: Novi alat umjetne inteligencije treba samo 15 sekundi da 'klonira' glas?
OpenAI je predstavio Voice Engine, revolucionarnu AI platformu za pretvaranje teksta u glas, potaknuvši znatiželju i raspravu o potencijalnim primjenama te tehnologije.
Kroz glasovni isječak od samo 15 sekundi, ta najnovija OpenAI-jeva inovacija može sintetizirati realističan glas sposoban čitati tekst na više jezika, što bi moglo imati ogroman utjecaj na razne industrije.
OpenAI-jev post na blogu naglašava značaj preliminarnih implementacija u oblikovanju etičkih razmatranja i istraživanju različitih aplikacija.
Bećiragić nakon poraza od Hrvatske: "Razlika od 13 koševa ništa ne znači u ludnici u Skenderiji"
Značajni korisnici ove tehnologije uključuju firme Age of Learning, Dimagi, Livox i Lifespan te HeyGen AI generator videa, od kojih svaki koristi Voice Engine za različite svrhe. Age of Learning, na primjer, koristi ga za generiranje unaprijed skriptiranog glasovnog sadržaja i isporuku personaliziranih odgovora učenicima.
Razvoj Voice Enginea seže unatrag do 2022. godine, a njegova evolucija je kulminirala unaprijed postavljenim glasovima za API, za pretvaranje teksta u govor i ChatGPT-ovu značajku Read Aloud. Jeff Harris iz OpenAI-jevog tima za proizvode otkrio je da je model prošao obuku na spoju licenciranih i javno dostupnih podataka, naglašavajući njegovu čvrstu osnovu.
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024
Krajolik zvuka generiranog umjetnom inteligencijom nastavlja se širiti, a Voice Engine označava značajan korak u tom razvoju. Međutim, etička razmatranja su velika, što pokazuje nedavni mandat američkog FCC-a koji zabranjuje glasovne pozive s umjetnom inteligencijom, što je upozoravajuća priča koja odražava zabrinutost koju je iznio sam OpenAI.
Partnerstvo OpenAI-ja propisuje pridržavanje strogih pravila korištenja, uključujući dobivanje izričitog pristanka od izvornog govornika, suzdržavanje od lažnog predstavljanja i otkrivanje porijekla AI slušateljima. Vodeni žig dodatno osigurava sljedivost i odgovornost u korištenju zvuka, odražavajući OpenAI-jev proaktivan stav u ublažavanju potencijalne zlouporabe.
Brojni su prijedlozi za ublažavanje rizika povezanih s glasovnom tehnologijom vođenom umjetnom inteligencijom, uključujući mjere kao što je postupno ukidanje glasovne autentifikacije za bankarstvo, snažne politike koje štite glasove pojedinaca, povećanu svijest javnosti o AI deep fake-ovima i razvoj sveobuhvatnih sustava praćenja za AI-generiranog sadržaja.
Kroz proaktivne mjere i zajedničke napore, transformativni potencijal Voice Enginea može se odgovorno iskoristiti, najavljujući novu eru u interakciji ljudi i stroja, piše Zimo.hr.
Radiosarajevo.ba pratite putem aplikacije za Android | iOS i društvenih mreža Twitter | Facebook | Instagram, kao i putem našeg Viber Chata.