Image
30.5.2017 0 Comments

Syntetizátor VoCo umožňuje editovať hlas v nahrávke len prepisom textu

Technológia vyvinutá počítačovými vedcami z Princetonskej univerzity môže robiť so zvukovými nahrávkami ľudského hlasu to, čo umožňuje robiť Photoshop s obrázkami.

Softvér VoCo, ktorý je ešte stále vo fáze výskumu, uľahčuje pridanie alebo nahradenie slova vo zvukovej nahrávke ľudského hlasu jednoduchou úpravou textového prepisu nahrávky. Nové slová sa automaticky syntetizujú hlasom hovoriaceho, aj keď sa v nahrávke nikde inde nevyskytujú.

Systém využíva sofistikovaný algoritmus na učenie a vytvorenie zvuku určitého hlasu. Jedného dňa by sa tak dali oveľa jednoduchšie upravovať podcasty či rozprávanie vo videu. Podľa spoluautora Adama Finkelsteina, profesora informatiky na Princetone,  by softvér mohol pomôcť aj ľuďom, ktorí stratili schopnosť hovoriť v dôsledku zranenia či choroby, obnoviť prostredníctvom robotického systému hlas, ktorý by znel prirodzene.

Predchádzajúca verzia VoCo bola predstavená  v novembri 2016. Dokument o súčasnom vývoji VoCo bude publikovaný v júlovom čísle časopisu Transactions on Graphics (v súčasnosti je dostupná predtlačová verzia).

Používateľské rozhranie VoCo je podobné ako pri inom softvéri na úpravu zvuku, ako je napr. program Audacity na úpravu podcastov. K dispozícii je priebeh zvukovej stopy a nástroje na kopírovanie, vkladanie a úpravu. Navyše však je tu aj textový prepis, kde môže používateľ nahradiť slová alebo vložiť nové. VoCo potom automaticky syntetizuje nové slovo spojením foném vyskytujúcich sa na inom mieste v prepise.

Softvér je založený na optimalizačnom algoritme, ktorý vyhľadáva v hlasovej nahrávke najlepšie vyhovujúce kombinácie foném na vytvorenie nových slov. Na to treba nájsť jednotlivé fonémy a ich sekvencie a spojiť ich bez náhlych prechodov. Pri tom treba prihliadať aj na kontext, aby nové slová boli vyslovené s náležitým dôrazom a intonáciou v závislosti od toho, kde sa vo vete nachádzajú.

Ak syntetizované slovo neznie úplne správne, VoCo ponúkne používateľovi niekoľko verzií výslovnosti, z ktorých si môže vybrať. Systém však umožňuje aj pokročilú editáciu, napr. úpravu rozstupov medzi slovami, trvanie slova, ale napr. aj výšku hlasu.

Na overenie efektívnosti systému vedci požiadali ľudí vypočuť niekoľko zvukových stôp, pričom niektoré z nich boli autentické, iné boli upravené pomocou VoCo. V 60 % prípadov ľudia považovali automatizované verzie za skutočné nahrávky.

Výskumníci z Princetonu teraz ďalej zdokonaľujú VoCo, aby zlepšili schopnosť systému integrovať syntetizované slová do zvukových stôp. Takisto chcú rozšíriť jeho schopnosť vytvoriť dlhšie frázy alebo dokonca celé syntetizované vety s hlasom rozprávača.

Softvér VoCo by sa dal použiť pre inteligentných digitálnych asistentov, ako je Siri, Alexa, Cortana či Google Assistant, ale aj na rekonštrukciu hlasov hercov zo starých filmov. Existujú však obavy z možného zneužitia. VoCo by totiž umožnil upraviť hlasové nahrávky a vložiť do nich slová, ktoré rozprávač nepovedal. Dokonca by bolo možné vytvoriť aj veľmi presvedčivé falošné videá.

Výskumníci z Princetonskej univerzity pri vývoji spolupracovali s vedcami z Adobe Research. Zatiaľ spoločnosť Adobe neoznámila predpokladanú dostupnosť komerčnej verzie ani zámer integrovať aplikáciu VoCo do programu Adobe Premiere Pro.

Zdroj: Kurzweilai

Zobrazit Galériu
Autor: Redakcia

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Technológie

Strojové učenie môže identifikovať hekerov a plagiátorských programátorov podľa ich „odtlačkov prstov“

16.08.2018 00:25

Programátori majú vlastné štýly, odlišné od ostatných, ale tie sa dajú zistiť len preštudovaním mnohých riadkov kódu a hľadaním stôp prezrádzajúcich autora. V budúcnosti to však nebude treba. Výskumní ...

Technológie

Nový telefón Oppo F9 má výrez, ktorý na rozdiel od konkurencie vyzerá naozaj dobre

16.08.2018 00:20

Spoločnosť Oppo ohlásila nový telefón F9 s výrezom, ktorý vyzerá skvelo. Je menší a menej rušivý ako na ostatných telefónoch. Nevyžaduje extra hrubú stavovú lištu na obrazovke a pôsobí ako prirodzená ...

Technológie 1

Komentár: 32-jadrový AMD Threadripper je výzva pre Intel v počte jadier aj cene

16.08.2018 00:15

AMD v týchto dňoch ohlásilo štyri nové modely z druhej generácie procesorov Ryzen Threadripper (nazývanej aj Threadripper 2) za zabijacke ceny vzhľadom na Intel. Druhá generácia Ryzen Threadripper 29 ...

q

Žiadne komentáre

Vyhľadávanie

Najnovšie videá



PC forum button