PC REVUE
Image
30.5.2017 0 Comments

Syntetizátor VoCo umožňuje editovať hlas v nahrávke len prepisom textu

Technológia vyvinutá počítačovými vedcami z Princetonskej univerzity môže robiť so zvukovými nahrávkami ľudského hlasu to, čo umožňuje robiť Photoshop s obrázkami.

Softvér VoCo, ktorý je ešte stále vo fáze výskumu, uľahčuje pridanie alebo nahradenie slova vo zvukovej nahrávke ľudského hlasu jednoduchou úpravou textového prepisu nahrávky. Nové slová sa automaticky syntetizujú hlasom hovoriaceho, aj keď sa v nahrávke nikde inde nevyskytujú.

Systém využíva sofistikovaný algoritmus na učenie a vytvorenie zvuku určitého hlasu. Jedného dňa by sa tak dali oveľa jednoduchšie upravovať podcasty či rozprávanie vo videu. Podľa spoluautora Adama Finkelsteina, profesora informatiky na Princetone,  by softvér mohol pomôcť aj ľuďom, ktorí stratili schopnosť hovoriť v dôsledku zranenia či choroby, obnoviť prostredníctvom robotického systému hlas, ktorý by znel prirodzene.

Predchádzajúca verzia VoCo bola predstavená  v novembri 2016. Dokument o súčasnom vývoji VoCo bude publikovaný v júlovom čísle časopisu Transactions on Graphics (v súčasnosti je dostupná predtlačová verzia).

Používateľské rozhranie VoCo je podobné ako pri inom softvéri na úpravu zvuku, ako je napr. program Audacity na úpravu podcastov. K dispozícii je priebeh zvukovej stopy a nástroje na kopírovanie, vkladanie a úpravu. Navyše však je tu aj textový prepis, kde môže používateľ nahradiť slová alebo vložiť nové. VoCo potom automaticky syntetizuje nové slovo spojením foném vyskytujúcich sa na inom mieste v prepise.

Softvér je založený na optimalizačnom algoritme, ktorý vyhľadáva v hlasovej nahrávke najlepšie vyhovujúce kombinácie foném na vytvorenie nových slov. Na to treba nájsť jednotlivé fonémy a ich sekvencie a spojiť ich bez náhlych prechodov. Pri tom treba prihliadať aj na kontext, aby nové slová boli vyslovené s náležitým dôrazom a intonáciou v závislosti od toho, kde sa vo vete nachádzajú.

Ak syntetizované slovo neznie úplne správne, VoCo ponúkne používateľovi niekoľko verzií výslovnosti, z ktorých si môže vybrať. Systém však umožňuje aj pokročilú editáciu, napr. úpravu rozstupov medzi slovami, trvanie slova, ale napr. aj výšku hlasu.

Na overenie efektívnosti systému vedci požiadali ľudí vypočuť niekoľko zvukových stôp, pričom niektoré z nich boli autentické, iné boli upravené pomocou VoCo. V 60 % prípadov ľudia považovali automatizované verzie za skutočné nahrávky.

Výskumníci z Princetonu teraz ďalej zdokonaľujú VoCo, aby zlepšili schopnosť systému integrovať syntetizované slová do zvukových stôp. Takisto chcú rozšíriť jeho schopnosť vytvoriť dlhšie frázy alebo dokonca celé syntetizované vety s hlasom rozprávača.

Softvér VoCo by sa dal použiť pre inteligentných digitálnych asistentov, ako je Siri, Alexa, Cortana či Google Assistant, ale aj na rekonštrukciu hlasov hercov zo starých filmov. Existujú však obavy z možného zneužitia. VoCo by totiž umožnil upraviť hlasové nahrávky a vložiť do nich slová, ktoré rozprávač nepovedal. Dokonca by bolo možné vytvoriť aj veľmi presvedčivé falošné videá.

Výskumníci z Princetonskej univerzity pri vývoji spolupracovali s vedcami z Adobe Research. Zatiaľ spoločnosť Adobe neoznámila predpokladanú dostupnosť komerčnej verzie ani zámer integrovať aplikáciu VoCo do programu Adobe Premiere Pro.

Zdroj: Kurzweilai

Zobrazit Galériu
Autor: Redakcia

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Technológie

Na Slovensku pribudne až 7 nových ultrarýchlych nabíjacích staníc

20.11.2018 22:16

O prvej ultrarýchlej nabíjacej stanici a ďalších plánoch v budovaní nabíjacej infraštruktúry pre elektromobily sme sa rozprávali so štátnym tajomníkom Ministerstva hospodárstva SR a zástupcami Západos ...

Technológie

Maroš Šefčovič, podpredseda Európskej komisie pre energetickú úniu, o elektromobilite na Slovensku

20.11.2018 20:48

Pri príležitosti spustenia prvej ultrarýchlej nabíjacej stanice v rámci strednej a východnej Európy na Slovensku nám pán Maroš Šefčovič, podpredseda Európskej komisie pre energetickú úniu, porozprával ...

Technológie 1

Prvá ultrarýchla nabíjacia stanica projektu NEXT-E v rámci strednej a východnej Európy bola otvorená na Slovensku

20.11.2018 16:19

Spoločnosť Západoslovenská energetika (ZSE) uvádza do prevádzky vôbec prvú ultrarýchlu nabíjaciu stanicu v rámci strednej a východnej Európy a iba druhú v rámci celej Európy. Nabíjacia stanica Ultra-f ...

q

Žiadne komentáre

Vyhľadávanie

SWAN_09

Najnovšie videá



PC forum button