Prehľad: Rozpoznávanie a pochopenie obsahu reči prechádza bodom zlomu

0
Bude hlasové ovládanie v priebehu pár rokov naozaj dominantným vstupným rozhraním počítačov alebo mu ešte niečo stojí v ceste? Prečo sa v posledných rokoch tak zlepšuje, kde sa všade uplatňuje a ako jeho prítomnosť výrazne ovplyvní našu budúcnosť? Navrhovanie strojov, ktoré by dokázali napodobňovať ľudské správanie, a to predovšetkým z hľadiska plynulého rozhovoru a reakcie na hlasové pokyny, je snom vedcov a inžinierov už celé storočia. To, že jedného dňa bude hlasový typ rozhrania v rámci ovládania techniky dominovať, je takmer isté. Tento fakt dobre odzrkadľuje aj kinematografia i vedecko-fantastická literatúra. Veď si len skúste predstaviť ďalekú budúcnosť, keď o jedno či dve storočia budeme používať pokročilých androidov, pričom ľudia by s nimi namiesto rozhovoru komunikovali tak, že by prišli k ich chrbtu a naťukali do nich niečo na dotykovom displeji či klávesnici, prípadne by ich ovládali nejakým druhom joysticku v ruke. Skromné počiatky a frustrácia trvajúca desaťročia Najranejšie pokusy tohto typu sa začali objavovať už v 50. rokoch minulého storočia v legendárnych Bellových laboratóriách. Šlo o systém z roku 1952, nazvaný Audrey (Automatic Digit Recognizer) a určený na rozpoznávanie hovorených čísel 1 až 9. Tento analógový stroj zložený z vákuových trubíc, pre ktoré sme v slovenčine používali výraz elektrónky, bol veľký ako dvojmetrová skriňa. Dokázal fungovať pomerne presne, ak bol vopred pripravený na konkrétny hlas a medzi číslami bola dostatočná medzera. Použiteľnosť v rámci telekomunikácií však bola veľmi malá, pretože bolo oveľa jednoduchšie a rýchlejšie čísla zadať ťukaním (či skôr vytáčaním), bez potreby masívneho stroja. Experimenty s rozpoznávaním reči v nasledujúcich desaťročiach sa dajú charakterizovať ako „útok hrubou silou“, pretože prakticky jediný postup, ktorý bol ako-tak účinný, bolo používanie preddefinovaných zvukových šablón, ku ktorým bol priradený význam. To relatívne fungovalo pri rozpoznávaní hŕstky konkrétnych slov, ale so ... Zobrazit Galériu

František Urban

Všetky autorove články
audio virtual Google technológie smartfon Microsoft Windows robot chat

Mohlo by vás zaujímať

Mohlo by vás zaujímať