Zastrašujuće: Novi alat umjetne inteligencije treba samo 15 sekundi da 'klonira' glas?

30.03.24. 21:14

Radiosarajevo.ba

Zastrašujuće: Novi alat umjetne inteligencije treba samo 15 sekundi da 'klonira' glas? — Foto: Rex Features / Ilustracija / Umjetna inteligencija

OpenAI je predstavio Voice Engine, revolucionarnu AI platformu za pretvaranje teksta u glas, potaknuvši znatiželju i raspravu o potencijalnim primjenama te tehnologije.

Kroz glasovni isječak od samo 15 sekundi, ta najnovija OpenAI-jeva inovacija može sintetizirati realističan glas sposoban čitati tekst na više jezika, što bi moglo imati ogroman utjecaj na razne industrije.

OpenAI-jev post na blogu naglašava značaj preliminarnih implementacija u oblikovanju etičkih razmatranja i istraživanju različitih aplikacija.

Trending

Kako je Vico Zeljković vidio žrijeb grupa za SP

Značajni korisnici ove tehnologije uključuju firme Age of Learning, Dimagi, Livox i Lifespan te HeyGen AI generator videa, od kojih svaki koristi Voice Engine za različite svrhe. Age of Learning, na primjer, koristi ga za generiranje unaprijed skriptiranog glasovnog sadržaja i isporuku personaliziranih odgovora učenicima.

Razvoj Voice Enginea seže unatrag do 2022. godine, a njegova evolucija je kulminirala unaprijed postavljenim glasovima za API, za pretvaranje teksta u govor i ChatGPT-ovu značajku Read Aloud. Jeff Harris iz OpenAI-jevog tima za proizvode otkrio je da je model prošao obuku na spoju licenciranih i javno dostupnih podataka, naglašavajući njegovu čvrstu osnovu.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024

Krajolik zvuka generiranog umjetnom inteligencijom nastavlja se širiti, a Voice Engine označava značajan korak u tom razvoju. Međutim, etička razmatranja su velika, što pokazuje nedavni mandat američkog FCC-a koji zabranjuje glasovne pozive s umjetnom inteligencijom, što je upozoravajuća priča koja odražava zabrinutost koju je iznio sam OpenAI.

Partnerstvo OpenAI-ja propisuje pridržavanje strogih pravila korištenja, uključujući dobivanje izričitog pristanka od izvornog govornika, suzdržavanje od lažnog predstavljanja i otkrivanje porijekla AI slušateljima. Vodeni žig dodatno osigurava sljedivost i odgovornost u korištenju zvuka, odražavajući OpenAI-jev proaktivan stav u ublažavanju potencijalne zlouporabe.

Brojni su prijedlozi za ublažavanje rizika povezanih s glasovnom tehnologijom vođenom umjetnom inteligencijom, uključujući mjere kao što je postupno ukidanje glasovne autentifikacije za bankarstvo, snažne politike koje štite glasove pojedinaca, povećanu svijest javnosti o AI deep fake-ovima i razvoj sveobuhvatnih sustava praćenja za AI-generiranog sadržaja.

Kroz proaktivne mjere i zajedničke napore, transformativni potencijal Voice Enginea može se odgovorno iskoristiti, najavljujući novu eru u interakciji ljudi i stroja, piše Zimo.hr.

Radiosarajevo.ba pratite putem aplikacije za Android | iOS i društvenih mreža Twitter | Facebook | Instagram, kao i putem našeg Viber Chata.

#umjetna inteligencija #Imitacija #glas

/ Komentari

Prikaži komentare (0)

/ Povezano

Umjetna inteligencija nije opasnost? Profesor iz Turske objašnjava kako

29.03.24. 13:29

/ Najnovije

Ponovo pao Cloudflare: Korisnici širom svijeta prijavljuju probleme

/ Tech i Prije oko 11h