• 1

Vreme čitanja: oko 1 min.

Pogledajte Mona Lizu koja repuje: Zahvaljujući veštačkoj inteligenciji otvara usta, podiže obrve i kapke

Vreme čitanja: oko 1 min.

Gestikulacija u generisanom videu je vrlo uverljiva

  • 1
Mona Liza "Mona Liza" / Foto: Wikipedia/Leonardo da Vinci
  • Na poznatom primeru istraživači Majkrosofta pokazali moć tehnologije

  • U istraživačkom radu istakli rizike obmanjujućih sadržaja

  • Nešto ranije sa sličnim rezultatima u javnost izašao i drugi tehnološki gigant - Gugl

Majkrosoft (Microsoft) je nedavno objavio istraživački rad u kojem prikazuje novi model veštačke inteligencije pod nazivom VASA-1 koji može da transformiše jednu sliku i audio-snimak osobe u realističan video na kom se sinhronizuju usne sa izrazima lica i pokretima glave.

Istraživači su se oslanjali na tehnologiju konkurentskih kompanija, kao što su Runway i Nvidia, ali navode da je njihov metod rada kvalitetniji, realističniji i da "značajno nadmašuje" postojeće metode, piše Entrepreneur.

Istraživači su rekli da model može da snima zvuk bilo koje dužine i da "stvori lice koje govori" u skladu sa snimkom.

Jedina slika koja nije generisana veštačkom inteligencijom sa kojom su istraživači eksperimentisali bila je čuvena Mona Liza. Napravili su Mona Lizu koja otvara usta u skladu sa rečima pesme "Paparazzi" En Hatavej, koja počinje rečima "Yo I’m a paparazzi, I don’t play no yahtzee".

Mona Liza je primer slike koju model veštačke inteligencije nije bio obučen da obradi, ali je ipak mogao da manipuliše njome. Model je takođe mogao da transformiše umetničke fotografije, obrađuje pevanje u audio formatu, kao i govor na jezicima koji nisu engleski.

Istraživači su naglasili da model može da radi u realnom vremenu sa demo snimkom koji je pokazao da model istog časa animira slike pokretima glave i izrazima lica.

Digitalno izmenjene ličnosti koje mogu da šire dezinformacije ili zloupotrebe sličnost sa nekim, predstavljaju rizik. Istraživači ističu da se protive obmanjujućim sadržajima, te da žele da učestvuju u otkrivanju falsifikata.

Gugl (Google) je prošlog meseca demonstrirao sličan istraživački projekat, pokazujući veštačku inteligenciju koja je sposobna da snimi fotografiju i napravi video od nje koju korisnik može da kontroliše svojim glasom. AI je mogao da doda pokrete glave, treptaje i pokrete rukama.

(Ubrzanje.rs)

Podelite vest:

Pošaljite nam Vaše snimke, fotografije i priče na broj telefona +381 64 8939257 (WhatsApp / Viber / Telegram).

Ubrzanje Telegraf zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.

Komentari

  • Перагеније

    2. maj 2024. | 17:41

    англосаксонска уметност...