Image
9.11.2016 0 Comments

GScan: Skenovanie dokumentov, dokladov a ručne vypĺňaných formulárov

Napriek pokročilej digitalizácii všetkých oblastí priemyslu, služieb, financií, štátnej a verejnej správy sa z rôznych dôvodov, často legislatívnych, ešte stále v určitých fázach mnohých procesov využívajú papierové dokumenty.

Typický príklad sú rôzne formuláre, ktoré sa ešte stále vyplňujú prevažne ručne, aj keď sú k dispozícii ich  elektronické ekvivalenty. Ide napríklad o platobné a prevodné príkazy v bankách. Iné dokumenty, napríklad faktúry, síce pochádzajú z rôznych heterogénnych účtovných, ERP a iných informačných systémov, ale k adresátovi prichádzajú v papierovej podobe alebo ako príloha e-mailov. Vtedy je síce dokument v elektronickej podobe, ale údaje z neho treba zadať alebo políčko po políčku prekopírovať do informačného systému firmy, takže takéto spracovanie elektronických dokumentov nie je oveľa komfortnejšie než v prípade papierových dokumentov.

GScan

Zefektívnenie zdĺhavých činností, náročných na sústredenie pracovníkov, ponúka riešenie GScan od spoločnosti Gradient. K dispozícii je niekoľko verzií. Desktopová aplikácia, ktorá ­ponúka najviac možností, je určená pre banky, utilitné spoločnosti, telekomunikačných operátorov, jednoducho pre firmy a organizácie, ktoré potrebujú spracúvať veľký objem dokumentov. Menšie firmy môžu využiť aplikáciu GScan Online pre SharePoint a Office 365, ktorá sa inštaluje priamo z Office 365 store.

Rozpoznávanie dokumentov funguje veľmi jednoducho, používateľ postupne označuje textové polia, v ktorých sa rozpoznávajú údaje. Aplikácia je úzko napojená na SharePoint, takže možno využiť workflow. Typický príklad je obchodný zástupca, ktorý naskenuje bločky z ciest, odošle ich do GScan online. Tým sa aktivuje procesný tok, údaje získané z naskenovaných a rozpoznaných bločkov sa odošlú účtovníčke.

Výhodou desktopovej aplikácie GScan je jednoduché používanie. Vďaka prednastaveným parametrom nemusí obsluha riešiť, ktorý dokument sa skenuje na ktorom skeneri, aké šablóny sa využívajú pri rozpoznávaní, aký je proces verifikácie a ktorí zamestnanci a manažéri sú na ňom zainteresovaní. GScan online podporuje aj mobilnú aplikáciu. Je to operatívne riešenie na rozpoznávanie dokumentov nasnímaných fotoaparátom smartfónu alebo tabletu. Pri všetkých verziách sa platí za objem spracovaných dokumentov, pričom určitý objem je k dispozícii zadarmo na vyskúšanie.


Príklad kvality skenu dokumentu zhotoveného mobilným telefónom

Ako to funguje?

Proces spravovania skenov dokumentov sa vykonáva v niekoľkých fázach. Prvý krok je logicky import dokumentu, môže to byť sken v obrazovom formáte, PDF, dokument kancelárskeho balíka a podobne. Nasleduje fáza predspracovania skenu. Predpokladá sa, že pri skenovaní papierového dokumentu môže podľa spôsobu skenovania vzniknúť obrazový materiál rôznej kvality. Počnúc precíznym skenovaním starostlivo vloženého a vycentrovaného dokumentu až po fotografiu z mobilného telefónu zhotovenú v zlých svetelných podmienkach, pričom dokument bol pri fotení pootočený o náhodný uhol. Preto treba pred fázou rozpoznávania obsahu naskenovaný obrázok upraviť.

Dôležité je spracovanie farieb. Formuláre na ručné vypĺňanie majú spravidla zelený podklad s výnimkou bielych políčok, do ktorých sa vpisujú texty. Ako príklad poslúži daňové priznanie. Formulár sa vypĺňa najčastejšie perom modrej alebo čiernej farby. Podklad formulára umožňuje odfiltrovať plochy, ktoré netreba rozpoznávať. Farby, ktoré nie sú relevantné na identifikáciu polohy údajov, sa v prípravnej fáze eliminujú, aby mal dokument čo najvyšší kontrast a dobre sa rozpoznával.

Tretí krok je samotné rozpoznávanie, či už fulltextové, ktoré sa uplatní napríklad pri skenovaní kníh a podobných viacstranových materiálov, alebo takzvané formulárové rozpoznávanie. Jednoduchší príklad sú takzvané statické formuláre, napríklad bankové, poisťovacie a podobne, kde je druh informácie daný polohou textového poľa, takže napríklad rodné číslo sa dá očakávať vždy na danom mieste. Pomocou editora šablón si používateľ môže vytvoriť šablóny pre takzvané pološtruktúrované dokumenty, napríklad rôzne zmluvy, faktúry, žiadanky a podobne. Tie obsahujú určité informácie, ale na rôznych dokumentoch môžu byť na rôznych miestach.

Nasleduje fáza indexácie, v ktorej sa z dokumentu vytvárajú metadáta, jednak informácie o dokumente, kto a kedy ho vytvoril, o aký typ ide, a aj informácie získané rozpoznávaním textu. Veľmi dôležitá je v mnohých prípadoch kontrola správnosti naskenovaných údajov. Posledná etapa je export dokumentu do cieľovej destinácie, napríklad informačného systému v požadovanom formáte.


Predspracovaný dokument vo fáze rozpoznávania

Oblasti použitia

GScan sa využíva v bankách na spracovanie platobných príkazov vypísaných rukou alebo vytlačených z ekonomického systému klienta. Ako už bolo spomenuté, rozpoznané údaje sa v prípade, kde ide o financie, skontrolujú a následne vložia do príslušného informačného systému banky. Využíva sa aj rozpoznávanie dokladov, ktoré majú takzvanú zónu MRZ (Machine ­Readable Zone). To umožňuje vkladať údaje načítané z dokladov priamo bez nutnosti prepisovania do rôznych zmlúv a iných dokladov.

GScan umožňuje skenovať aj špeciálne dokumenty, prípadne ich časti. Ako príklad možno uviesť skenovanie tabuliek z výkresov, ktoré môžu mať aj veľký formát (A0, A1...), a ukladanie metadát získaných z týchto tabuliek do informačných systémov. Najčastejšie sa takto rozpoznávajú hlavičky faktúr. Silná stránka aplikácie je rozpoznávanie viacjazyčných faktúr.

Ukladaním obsahu dokumentov namiesto obrazových súborov s ich skenmi sa výrazne šetrí úložný priestor. Typická veľkosť uloženého dokumentu je 15 – 30 kB, čo je minimálne 100× menej ako pri ukladaní obrazových súborov. Navyše textové dokumenty, prípadne dokumenty iného typu, ako napr. výkresy či obchodná grafika s uloženými metadátami, umožňujú fulltextové vyhľadávanie. Táto možnosť je neoceniteľná pri auditoch, riešení reklamácií a podobne. Po indexovaní sa dá na dokumenty použiť aj integrované vyhľadávanie v SharePointe. 

Nie vždy treba verifikovať údaje z fulltextového skenovania. Dobrý príklad sú rôzne pripomienky, sťažnosti, návrhy a podobne, kde zámena písmena vzniknutá pri rozpoznávaní je akceptovateľná a neznižuje informačný obsah a čitateľnosť textu. Zle rozpoznaná číslica v bankovom prevodnom príkaze alebo vo faktúre by bola zásadný problém, preto je dôležitá kontrola, často viacstupňová, pri ktorej naskenované a rozpoznané údaje z platobného príkazu najskôr skontroluje priehradkový pracovník a po ňom ešte príslušný manažér.

GScan sa dá využiť aj pri transformácii archívnych dokumentov, ktoré sú rôznym spôsobom uložené v súborových systémoch serverov alebo dokonca jednotlivých pracovníkov, najčastejšie v zložkách po rokoch, mesiacoch a zákazníkoch. Názvy zložiek sa potom dajú uložiť do príslušných políčok metadát (dátum, zákazník...). 

Vynikajúco funguje automatické rozpoznávanie formulárov, pre ktoré nie sú k dispozícii statické šablóny. Typický príklad sú faktúry, ktoré prichádzajú od rozličných obchodných partnerov z rôznych krajín a každá z nich má iné rozloženie kľúčových údajov. GScan aplikuje na takýto dokument postupné vyhľadávanie kľúčových slov, podľa ktorých zistí polohu požadovaných údajov v rámci dokumentu a následne rozpoznáva používateľom zadané údaje vedľa kľúčových slov alebo pod nimi. U obchodných partnerov uložených v databáze netreba rozpoznávať všetky požadované údaje, stačí rozpoznať kľúčový identifikačný údaj, napríklad IČO, a do dokumentu sa potom uložia ostatné údaje z databázy. Keďže úspešnosť rozpo­znávania nikdy nie je 100 percent, takéto dopĺňanie údajov významne zmenšuje počet chýb.

Zobrazit Galériu

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

ITPro

Základ úspešného DMS? Efektívna digitalizácia!

12.11.2019 14:22

Špeciálny projekt Správa dokumentov, papierových i elektronických, je jedna zo základných agend každej organizácie. V prípade digitálnych dokumentov uľahčujú potrebné procesy takzvané systémy DMS (Do ...

ITPro

IT Pro: DNS cez HTTPS – budúcnosť súkromia na webe

08.11.2019 00:00

Dnes je šifrované spojenie na internete cez HTTPS štandardom (veríme, že rozumní administrátori toto považujú za skutočný základ) – toto šifrovanie totiž pomáha chrániť citlivé informácie prenášané c ...

ITPro

Praktická kryptológia (28. časť) HMAC

18.10.2019 14:56

Mechanizmus autentifikácie obsahu správ pomocou symetrických kľúčov a kryptografických hašovacích funkcií (Keyed-Hash Message Authentication Code) je detailne opísaný v správe RFC 2104 z februára 1997 ...

Žiadne komentáre

Vyhľadávanie

Najnovšie videá