Tim iz Amazona objavio zapanjujuće tvdnje: "Naš AI može raditi stvari koje ga nismo naučili"
Novi model Amazonove umjetne inteligencije pokazuje jezične sposobnosti na kojima nije treniran, tvrde istraživači koji su ga izradili.
U još nerecenziranom akademskom radu, tim u Amazonu AGI - što je kratica za "umjetnu opću inteligenciju" ili, uslovno, AI na nivou čovjeka - kaže da njihov veliki jezični model (LLM) pokazuje "čudesnu prirodnost" kad razgovara. Prema primjerima iznesenim u radu, model se zaista čini iznimno sofisticiranim.
Kao što dokument pokazuje, model je uspio smisliti rečenice koje su, prema kriterijima izrađenim uz pomoć stručnog lingvista, pokazivale da radi vrste tzv. jezičnih skokova koji su prirodni kod ljudi koji uče neki jezik, ali dosad ih je bilo teško dobiti kod AI-ja.
Poslušajte himnu Bosne i Hercegovine u punoj Skenderiji protiv Hrvatske
Nazvan "Big Adaptive Streamable TTS with Emergent abilities" ili BASE TTS, početni model je uvježban na 100.000 sati "govornih podataka iz javne domene" - 90 posto na engleskom, kako bi ga se naučilo kako Amerikanci govore. Kako bi testirali koliko veliki bi modeli morali biti da pokažu "napredne sposobnosti" ili sposobnosti za koje nisu trenirani, tim Amazon AGI napravio je i dva manja modela, jedan obučen na 1.000 sati govornih podataka, a drugi na 10.000.
Zanimljivo je da je upravo model od 10.000 sati postigao najviše bodova na popisu kriterija istraživača Amazona, što je uključivalo stvari poput sposobnosti razumijevanja interpunkcije, neengleskih riječi i emocije.
Srednji model davao je rečenice koje bi se ljudima činile vrlo prirodnim, pokazujući sposobnost transkripcije tzv. ne-riječi ("Ššš, Lucy, šššš, ne smijemo probuditi tvog malog brata", šapnuo je Tom dok su na prstima prolazili pokraj dječje sobe"), pa čak i onu vrstu internetskog govora koju mnogi koriste u tekstualnim porukama, ali i govornom jeziku ("Primila je neobičan tekst od svog brata: 'Hitno je kod kuće; nazovi što prije! Mama i tata su zabrinuti… #familymatters.'").
Umjetna inteligencija dosegla novi nivo: Šta je Sora - kako pretvara tekst u video?
U radu, čiji međunarodni tim autora uključuje 18 stručnjaka za umjetnu inteligenciju, konzorcij Amazon AGI istaknuo je da BASE TTS-u nikada nije bilo "izričito" rečeno da osmisli takve rečenice.
"Ove su rečenice formirane tako da sadrže izazovne zadatke — raščlanjivanje rečenica, stavljanje frazalnog naglaska na dugotrajne složene imenice, stvaranje emocionalnog ili govora šapatom ili stvaranje tačnih fonema za strane riječi poput 'qi' ili znakova poput '@' — ni za šta od toga BASE TTS nije bio obučen", navodi tim.
BASE TTS nije AGI, naravno — ali ovi bi nalazi bez obzira na to mogli imati važne implikacije na putu prema tom cilju, pogotovo ako se potvrdi da sad znamo da ne treba tako ogroman skup podataka o obuci da bi se došlo do toga.
Radiosarajevo.ba pratite putem aplikacije za Android | iOS i društvenih mreža Twitter | Facebook | Instagram, kao i putem našeg Viber Chata.