Image
3.10.2019 2 Comments

Umelá inteligencia dokáže vytvoriť syntetický hlas iba na základe 5 minút počúvania ľudskej reči

Výcvik výkonných modelov prevodu textu na reč vyžaduje dostatočne výkonný hardvér. Vedci z IBM však hľadajú menej náročné modely a vyvinuli novú, ľahkú a modulárnu metódu syntézy reči. Tvrdia, že dokáže syntetizovať reč vysokej kvality v reálnom čase tým, že si osvojí rôzne aspekty hlasu hovoriaceho, čo umožňuje prispôsobiť sa novým štýlom a hlasom hovoriacich s použitím iba malého množstva údajov.

Hoci schopnosti systémov TTS (Text-to-Speech) sa v poslednom čase dramaticky zlepšujú, väčšina z nich je závislá od veľkých a komplexných modelov neurónových sietí, ktoré je ťažké trénovať. To znemožňuje syntézu reči v reálnom čase. Nový model, ktorý má tento problém vyriešiť, je založený na modulárnej architektúre.

Systém IBM pozostáva z troch častí: prediktora funkcie prozódie (prízvuku), prediktora akustickej funkcie a neurónového vokodéra, ktorý generuje ukážky reči z akustických prvkov. Všetky komponenty spolupracujú na prispôsobení umelého hlasu cieľovému hovoriacemu preškolením na základe malého množstva údajov od neho.

V teste potom požiadali dobrovoľníkov, aby si vypočuli a vyhodnotili dvojice hlasových vzoriek – so syntetizovaným a prirodzeným hlasom. Zistilo sa, že model vykazuje vysokú kvalitu a veľkú podobnosť s pôvodným hovoriacim už po vyškolení na 5 minútach hlasového prejavu rečníka.

Zdroj: venturebeat.com.

Autor: Redakcia

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Výskum a vývoj 3

UI dokáže v priebehu 15 minút odhadnúť riziko úmrtia na srdcové ochorenie

18.09.2019 00:15

Umelá inteligencia má schopnosť predvídať potencionálne hrozby funkcie vášho srdca. Vedci vyvinuli prístroj RiskCardio, ktorý dokáže odhadnúť riziko úmrtia pre kardiovaskulárne problémy. Potrebuje na ...

Výskum a vývoj

Umelá inteligencia našla potenciálny nový liek iba za 21 dní

12.09.2019 00:15

Uvedenie nového lieku na trh je veľmi nákladné a časovo náročné, pričom drvivá väčšina kandidátov zlyhá ešte vo fáze testovania. Niet divu, že na urýchlenie tohto procesu sa už využíva aj umelá intel ...

Výskum a vývoj

Robotická niť sa dokáže plaziť cez krvné cievy v mozgu

04.09.2019 00:20

Vedci z Massachusetts Institute of Technology (MIT) vyvinuli magneticky riaditeľného „robota v tvare vlákna“, ktorý je schopný sa ľahko kĺzať cez úzke dráhy mozgu a priamo liečiť zranenia a blokády. ...

2 Comments

  1. Skutočnoosť je iná reakcia na: Umelá inteligencia dokáže vytvoriť syntetický hlas iba na základe 5 minút počúvania ľudskej reči
    Autor: Mark
    3.10.2019 23:10
    So sto percentnou pravdepodobnosťou sa nejedná o Umelú inteligenciu ale o metódu strojového učenia takže milí vedci trafili vedľa.
    Reagovať
  2. Aka je to velka podobnost? reakcia na: Umelá inteligencia dokáže vytvoriť syntetický hlas iba na základe 5 minút počúvania ľudskej reči
    3.10.2019 14:10
    .
    Reagovať

Vyhľadávanie

Najnovšie videá

SlovakiaTech 2019