Naučnici usavršavaju novu vrstu algoritama koja može da napravi film koristeći se isključivo (za sada) kratkim tekstom
Tekst: Ivana Nikolić
Filmski scenaristi će uskoro imati novu mogućnost koja im najverovatnije neće doneti Oskara – snimanje filmova uz pomoć kratkog teksta. Naime, reč je o novoj vrsti veštačke inteligencije, takozvanim generativnim algoritmima koji su u stanju da proizvode slike od datog teksta ili čak od skenova mozga. Mada slični pronalasci postoje i usavršavaju se već duže vreme, novitet je u tome što ovaj aparat pravi slike koje se pomeraju u skladu sa onim što je napisano u za sada kratkom tekstu.
Ovaj novi algoritam, koji su proizveli istraživači sa američkog Univerziteta Djuk, predstavlja vrstu veštačke inteligencije (machine learning) gde uređaji sami uče da preduzimaju određene radnje. Ovde je konkretno reč o mrežama neurona, odnosno o nizu slojeva malih računarskih elemenata koji obrađuju podatke na način koji podseća na ono što rade neuroni. U ovom procesu kompjuter sam „uči” da preduzima radnje i tokom takvih treninga softver ocenjuje svoje performanse nakon svakog pokušaja i radi na tome da ih poboljša i vremenom nauči.
Ova mreža neurona ima dve faze. U prvoj se tekst koristi kako bi se stvorila sama suština videa, što je u osnovi zamagljena slika pozadine sa zamućenim centrom u kome se dešava glavna radnja. U drugoj fazi se koristi i suština videa i tekst kako bi se stvorio kratak video. Tokom treninga druga mreža radi kao diskriminator i posmatra video koji ilustruje, na primer jedrenje na moru, pored pravog videa koji to prikazuje i uči se da odabere onaj pravi. Vežbanjem mreža postaje sve bolji i oštriji kritičar što utiče na generatorsku mrežu koja se na taj način dalje usavršava.
Trenutno ovi filmovi traju oko jedne sekunde i veličine su američkih poštanskih markica, 64 sa 64 piksela. Prema rečima Jitonga Lia, kompjuterskog naučnika sa Djuk univerziteta i prvog autora studije, sve što je veće od toga smanjuje tačnost. S obzirom da u ovim filmovima ljudi najčešće izgledaju potpuno iskrivljeno, sledeći korak njegovog tima jeste korišćenje ljudskih skeletnih modela za poboljšanje kretanja i izgleda.
Istraživači koji se bave ovom temom veruju da ovi algoritmi mogu da imaju širu upotrebu nego što je snimanje filmova. Osim što mogu da pomognu u rekonstrukciji zločina, mogu da budu korisni i za generisanje sličnih machine learning algoritama. Na primer, ovakvi realni video-snimci mogu da pomognu i takozvanim autonomnim automobilima da se pripreme za opasne situacije ili čak da obuče kućnog robota da otvara frižider.