Image
30.5.2017 0 Comments

Syntetizátor VoCo umožňuje editovať hlas v nahrávke len prepisom textu

Technológia vyvinutá počítačovými vedcami z Princetonskej univerzity môže robiť so zvukovými nahrávkami ľudského hlasu to, čo umožňuje robiť Photoshop s obrázkami.

Softvér VoCo, ktorý je ešte stále vo fáze výskumu, uľahčuje pridanie alebo nahradenie slova vo zvukovej nahrávke ľudského hlasu jednoduchou úpravou textového prepisu nahrávky. Nové slová sa automaticky syntetizujú hlasom hovoriaceho, aj keď sa v nahrávke nikde inde nevyskytujú.

Systém využíva sofistikovaný algoritmus na učenie a vytvorenie zvuku určitého hlasu. Jedného dňa by sa tak dali oveľa jednoduchšie upravovať podcasty či rozprávanie vo videu. Podľa spoluautora Adama Finkelsteina, profesora informatiky na Princetone,  by softvér mohol pomôcť aj ľuďom, ktorí stratili schopnosť hovoriť v dôsledku zranenia či choroby, obnoviť prostredníctvom robotického systému hlas, ktorý by znel prirodzene.

Predchádzajúca verzia VoCo bola predstavená  v novembri 2016. Dokument o súčasnom vývoji VoCo bude publikovaný v júlovom čísle časopisu Transactions on Graphics (v súčasnosti je dostupná predtlačová verzia).

Používateľské rozhranie VoCo je podobné ako pri inom softvéri na úpravu zvuku, ako je napr. program Audacity na úpravu podcastov. K dispozícii je priebeh zvukovej stopy a nástroje na kopírovanie, vkladanie a úpravu. Navyše však je tu aj textový prepis, kde môže používateľ nahradiť slová alebo vložiť nové. VoCo potom automaticky syntetizuje nové slovo spojením foném vyskytujúcich sa na inom mieste v prepise.

Softvér je založený na optimalizačnom algoritme, ktorý vyhľadáva v hlasovej nahrávke najlepšie vyhovujúce kombinácie foném na vytvorenie nových slov. Na to treba nájsť jednotlivé fonémy a ich sekvencie a spojiť ich bez náhlych prechodov. Pri tom treba prihliadať aj na kontext, aby nové slová boli vyslovené s náležitým dôrazom a intonáciou v závislosti od toho, kde sa vo vete nachádzajú.

Ak syntetizované slovo neznie úplne správne, VoCo ponúkne používateľovi niekoľko verzií výslovnosti, z ktorých si môže vybrať. Systém však umožňuje aj pokročilú editáciu, napr. úpravu rozstupov medzi slovami, trvanie slova, ale napr. aj výšku hlasu.

Na overenie efektívnosti systému vedci požiadali ľudí vypočuť niekoľko zvukových stôp, pričom niektoré z nich boli autentické, iné boli upravené pomocou VoCo. V 60 % prípadov ľudia považovali automatizované verzie za skutočné nahrávky.

Výskumníci z Princetonu teraz ďalej zdokonaľujú VoCo, aby zlepšili schopnosť systému integrovať syntetizované slová do zvukových stôp. Takisto chcú rozšíriť jeho schopnosť vytvoriť dlhšie frázy alebo dokonca celé syntetizované vety s hlasom rozprávača.

Softvér VoCo by sa dal použiť pre inteligentných digitálnych asistentov, ako je Siri, Alexa, Cortana či Google Assistant, ale aj na rekonštrukciu hlasov hercov zo starých filmov. Existujú však obavy z možného zneužitia. VoCo by totiž umožnil upraviť hlasové nahrávky a vložiť do nich slová, ktoré rozprávač nepovedal. Dokonca by bolo možné vytvoriť aj veľmi presvedčivé falošné videá.

Výskumníci z Princetonskej univerzity pri vývoji spolupracovali s vedcami z Adobe Research. Zatiaľ spoločnosť Adobe neoznámila predpokladanú dostupnosť komerčnej verzie ani zámer integrovať aplikáciu VoCo do programu Adobe Premiere Pro.

Zdroj: Kurzweilai

Zobrazit Galériu
Autor: Redakcia

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Technológie

WhiteSmoke používa umelú inteligenciu na opravu hrúbok, preklepov aj chýbajúcej interpunkcie

24.05.2018 00:20

Keď celý deň píšete e-maily a správy, ľahko môžete urobiť preklep. Správa s chybami však môže vyvolať u prijímateľa rozpaky. WhiteSmoke je aplikácia, ktorá používa inteligentné algoritmy na vyhľadanie ...

Technológie 3

Lasery by mohli urobiť počítače miliónkrát rýchlejšími

23.05.2018 00:20

Nová výpočtová technika využívajúca impulzy laserového svetla by sa mohla prepínať medzi stavmi 0 a 1 miliónkrát rýchlejšie ako dnešné počítače. Súčasné polovodičové počítače zvládnu okolo jednej mil ...

Technológie

Exkurzia do robotizovaného distribučného centra Amazonu v Štetíne

23.05.2018 00:05

Amazon pri budovaní svojich distribučných centier jednoznačne vsadil na roboty. Najskôr túto koncepciu vyskúšal v niekoľkých centrách v USA, v roku 2015 sme navštívili takéto pracovisko pri San Franci ...

Žiadne komentáre

Vyhľadávanie

SWAN_05

Najnovšie videá

ATOS_05_262


PC forum button