Falošné videá sa dajú robiť ešte ľahšie. Stačí napísať, čo má kto povedať

Technológie
0

Medzinárodný tím vedcov zo Stanfordovej univerzity, Inštitútu Maxa Plancka pre informatiku, Princetonskej univerzity a Adobe Research dokazuje, že možnosť upravovať to, čo hovoria ľudia vo videách, a vytvárať realistické falzifikáty, je čoraz jednoduchšia.

Vo videu môžete vidieť niekoľko príkladov výstupu systému vrátane upravenej verzie slávneho citátu z filmu Apocalypse Now z podoby „I love the smell of napalm in the morning” („Milujem rannú vôňu napalmu“) na „I love the smell of french toast in the morning“ („Milujem rannú vôňu francúzskeho toastu“).

Zatiaľ ide o výskumnú prácu a nie je k dispozícii spotrebiteľská verzia softvéru. No pravdepodobne nebude trvať dlho, kým sa podobné služby stanú verejnými. Adobe už napríklad publikoval podrobnosti o prototypovom softvéri s názvom VoCo, ktorý umožňuje používateľom upravovať nahrávky reči tak jednoducho, ako sa to dá v prípade obrazu. Tento softvér bol použitý aj vo výskume.

Pri tvorbe falošných videí vedci kombinujú niekoľko techník. Najprv naskenujú cieľové video a izolujú fonémy hovorené subjektom. Potom priraďujú k týmto fonémam zodpovedajúce „vizémy“ – výrazy tváre, ktoré sprevádzajú každý zvuk.

Nakoniec vytvoria 3D model spodnej polovice tváre subjektu pomocou cieľového videa. Keď sa text upraví, softvér spojí všetky zozbierané údaje (fonémy, vizémy a 3D model tváre) na vytvorenie nového záznamu, ktorý zodpovedá zadanému textu. Napokon sa tento výsledok vloží do zdrojového videa.

Keď si v teste video pozrelo 138 dobrovoľníkov, 60 % z nich označilo editované video za skutočné. Môže sa to zdať málo, ale iba 80 % účastníkov označilo za skutočné pôvodné, neupravené video. (Vedci hovoria, že je to tak preto, že účastníci boli informovaní, že ich odpovede budú použité v štúdii o strihu videa, a tak boli pripravení na to, že budú mať do činenia s falzifikátmi.)

Samozrejme, aj táto technológia má svoje obmedzenia. Algoritmy fungujú len na videách zachytávajúcich hlavu hovoriaceho a vyžadujú 40 minút vstupných údajov. Upravený prejav sa nemôže priveľmi líšiť od zdrojového materiálu. Výskumníci takisto poznamenávajú, že nemôžu zmeniť náladu alebo tón hlasu hovoriaceho. Navyše akékoľvek rušivé prvky pri tvári (napr. keď niekto máva pri hovorení rukami) algoritmus úplne rozhádžu.

Pravda, výskum je zatiaľ v ranom štádiu a možno predpokladať, že tieto obmedzenia budú postupne odstránené. To znamená, že čoskoro môže byť k dispozícii softvér, ktorý umožní komukoľvek aj bez technického školenia upraviť to, čo hovoria ľudia vo videách. Možnosti zneužitia tejto technológie sú znepokojivé a vedci sú často kritizovaní, že to nezohľadňujú pri svojej práci.

Vedci hovoria, že ich technológia má veľa možností užitočného použitia. Bola by veľkým prínosom pre filmový a televízny priemysel, pretože by umožnila opraviť nesprávne časti bez opakovania celého záznamu a vytvoriť bezproblémové dabovanie hercov hovoriacich rôznymi jazykmi.

Zdroj: theverge.com.

Zobrazit Galériu

Redakcia

Všetky autorove články
kamera foto video softver app aplikácia vyskum pocitac umelá inteligencia AI

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať