Vreme čitanja: oko 2 min.
Pogledajte kako Gugl pravi video od slike: Uz pomoć audio zapisa, avatar će izgledati i govoriti kao vi
Vreme čitanja: oko 2 min.
Ovaj AI alat "usvaja" način na koji se usne i telo osobe kreću, verno prenoseći njenu mimiku i gestikulaciju (generisanom) avataru
![Google Google](https://xdn.tf.rs/2024/03/07/google-460x0.jpg)
-
Istraživači ove velike tehnološke kompanije rade na alatu koji bi uz pomoć veštačke inteligencije omogućio pravljenje videa od slike
-
Za verno prikazivanje "kopira" pokrete glave i tela, zaključno sa micanjem usana
-
Pitanje koje se skriveno nameće jeste - koliko je nova tehnologija podložna zloupotrebi, a koliko korisna?
Guglovi (Google) istraživači u poslednje su vreme radili prekovremeno kako bi realizovali svoje nadolazeće ideje. Najnovija je bila - naći način da se "mirujuća" slika koristi za prevaranje u avatara.
Reč je o alatu zasnovanom na veštačkoj inteligenciji (AI), po imenu Vloger (Vlogger), koji trenutno nije dostupan za javnost, međutim demo sugeriše da će omogućuti pravljenje avatara i njegovo kontrolisanje uz pomoć glasa. A kako dodaje Tom's guide, sve to izgleda iznenađujuće realistično.
Trenutno, Vloger je samo projekat sa nekoliko zabavnih demo videa, ali ako ikada bude pretvoren u proizvod, mogao bi biti novi način komunikacije u Timsu (Teams) ili Sleku (Slack).
Ovaj AI model uspeva da zadrži fotorealističan izgled osobe sa fotografije - na svakom kadru videa. Takođe koristi audio zapis osobe koja govori, način na koji joj se telo i usne kreću, kako bi je predstavilo u najvernijem izdanju.
This is scary!Google just revealed VLOGGER, and it can create almost realistic talking + moving videos from JUST ONE PHOTO.Here's what you need to know:(+ more examples) pic.twitter.com/V61Sb0Xr9n— Roni Rahman (@heyronir) March 19, 2024
Ovo uključuje pokrete glave, izraze lica, pogled, treptanje, kao i gestikulaciju rukama i gornjim delom tela.
Koja su ograničenja Vlogera?
Sve dok generisano kretanje izgleda realistično, ne mora sasvim odgovarati pravom načinu na koji se neka osoba kreće. Zbog načina na koji je napravljen, sklon je, kažu, nepredvidljivosti.
Tim Gugla navodi da takođe ima problema sa posebno velikim pokretima ili raznovrsnim okruženjima. Takođe, može da obradi samo relativno kratke video zapise.
Image to Video Generation:Here are more examples of talking face generation using just a single input image and driving audio. pic.twitter.com/7bZUkIxhVi— Roni Rahman (@heyronir) March 19, 2024
Za šta se koristi Vloger?
Jedan od primarnih načina upotrebe je za prevod videa. Na primer, uzimanje postojećeg videa na određenom jeziku i "uređivanje" usana i lica kako bi odgovarali novom, prevedenom audio snimku.
Drugi mogući slučajevi upotrebe uključuju kreiranje avatara za virtuelne asistente, četbotove ili virtuelne likove koji izgledaju i kreću se realistično u datom okruženju.
More close example: pic.twitter.com/lE5Y0hTgcG— Roni Rahman (@heyronir) March 19, 2024
Postoje alati koji već nešto slično rade, uključujući Synthesia, gde korisnici mogu otići u kancelarije kompanije i kreirati svoj virtualni avatar kako bi održali prezentacije, ali ovaj novi model čini proces mnogo lakšim.
Jedna moguća primena je pružanje video komunikacije. Buduća verzija modela mogla bi omogućiti video razgovore animiranjem avatara.
(Ubrzanje.rs)
Video: "Ako ne vodimo računa, ovakav scenario može da se desi čak i brže": O mračnom predviđanju Nobelovca
Ubrzanje Telegraf zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.