Image
9.11.2016 0 Comments

Predpovedať budúcnosť je stále jednoduchšie

Pri firmách, ktoré využívajú prediktívnu analytiku, je dvakrát vyššia pravdepodobnosť, že posilnia svoj trhový podiel a prekročia svoje obchodné ciele. Tvrdí to nedávny prieskum analytickej spoločnosti Forrester; až 83 percent firiem, ktoré nasadili takéto prostriedky, podľa neho zaznamenalo výrazný pozitívny dosah na svoje podnikanie. Ako je teda možné, že prediktívna analytika nie je úplná samozrejmosť v každej firme?

Opis či predpoveď

Príčinou môžu byť mýty, ktoré sa s prediktívnou analytikou stále spájajú. Cieľom akejkoľvek analytiky je pozrieť sa na dostupné dáta a na ich základe vytvoriť podklady na čo najlepšie rozhodnutie. Aký je teda rozdiel medzi deskriptívnou a prediktívnou analytikou, ak obe vychádzajú zo známych predošlých dát? Akým spôsobom dokážu analytické nástroje dať odpoveď napríklad na úplne bežnú otázku, prečo zákazníci prestávajú využívať služby podniku?

Tradičná opisná analýza sa pozrie na dostupné dáta a rozpitve ich do detailov. Zjednodušene povedané, vezme si napríklad segment zákazníkov, ktorí službu reálne zrušili, vyhľadá, čo majú spoločné, a na základe zisteného vzorca identifikuje ďalších rizikových zákazníkov. Výsledok sa do veľkej miery spolieha na analytikovu znalosť trhu, zákazníkov, celého súboru dát a jeho skúsenosti s výberom relevantnej vzorky.

Pri prediktívnej analýze sa o výsledok postará súbor matematických algoritmov. Tento prístup spočíva vo „vycvičení“ prediktívneho modelu na základe údajov o všetkých zákazníkoch bez ohľadu na to, či službu prestali používať alebo nie. Model pracuje so všetkými charakteristikami zákazníka a zisťuje, do akej miery môžu prispieť k jeho rozhodnutiu. Každému potom prideľuje pravdepodobnostné skóre, ktoré „predpovedá“ jeho náchylnosť na skúmané správanie.

Nielen pre dátových vedcov

Pokročilé prediktívne analýzy už nie sú výsadou dátových vedcov. Prispôsobujú sa znalostiam a možnostiam analytika biznisu. Dalo by sa povedať, že dochádza k demokratizácii prediktívnej analytiky – na jej využívanie dnes už netreba ovládať rôzne algoritmy a ich vhodnosť pre jednotlivé situácie, rovnako ani vedieť interpretovať výsledky – to všetko by už mali ponúkať riešenia business intelligence. Cieľom je, aby prediktívna analytika a jej výhody boli jednoducho dostupné širokému spektru zamestnancov.

Na skutočnú demokratizáciu prediktívnej analytiky však treba splniť niektoré podmienky. Ide najmä o automatickú prípravu dát, ktorá by bola odolná proti bežným nedostatkom, ktorými sú chýbajúce údaje alebo rôzne dátové typy s potrebou ich konverzie. Nevyhnutné sú aj skutočne odolné algoritmy a využitie princípov strojového učenia pri výbere najdôležitejších premenných, teda faktorov, ktorých kombinácia má najväčší efekt na cieľovú veličinu. Do tretice je podmienkou výber najkvalitnejšieho prediktívneho modelu – spoľahlivosť pri vysvetľovaní správania sa cieľovej skupiny, ale aj stálosť a odolnosť modelu pri použití ďalších nových dát.

Samozrejme, pre biznis je zásadné využiť výsledky prediktívnej analýzy v praxi, či už ide o oblasť business intelligence, alebo prevádzkové procesy typu call centrum, marketingové kampane, údržbu, finančné alebo HR procesy.

ROI namiesto TCO

Mnoho firiem stále pristupuje k prediktívnej analytike s obavami či predsudkami. Tie sa najčastejšie týkajú ceny riešení. Diskusia by sa však nemala obmedziť na celkové náklady na vlastníctvo. Mala by to byť skôr debata na tému miery návratnosti investície. Vo svete biznisu ide o zvýšenie zisku. To sa dá dosiahnuť dvoma spôsobmi – znížením nákladov alebo zvýšením príjmov. Prediktívna analytika môže dať pozitívnu odpoveď na oba z nich.

Ďalší častý prejav je nedôvera v reálnu funkcionalitu riešení. Princípy prediktívnej analytiky sú totiž známe už dlho. No na to, aby sa dali reálne a každodenne využívať v biznise (a nielen v laboratórnych podmienkach), neexistovali vhodné technológie.

Presné, a teda aj zmysluplné analýzy totiž vyžadujú veľké množstvo vstupných dát. Veľkosť dátového súboru sa často chybne spája len s počtom riadkov v tabuľkách – v skutočnosti je pre prediktívnu analýzu oveľa dôležitejší počet stĺpcov čiže charakteristík, ktoré opisujú skúmaný objekt.

Koľko by ste ich dokázali na svojom zákazníkovi nájsť vy? Desiatky? Stovky? V oblasti prediktívnych analýz sa pri počte stĺpcov dostávame k číslam rádovo v tisíckach, často prekračujúcich 10-tisíc. S pomocou vhodného algoritmu a dostatočného výpočtového výkonu už možno dosiahnuť pomerne presnú predikciu. Čítanie takýchto množstiev dát z disku je však pomalé a nevhodné do sveta biznisu, kde na rozhodnutia nemožno čakať dni a týždne.

Preto vznikla technológia in-memory computing, ktorá výrazne zrýchľuje čítanie a operácie nad obrovským množstvom dát v reálnom čase. Ide o kombináciu hardvérových inovácií (ako sú architektúra MPP, optimalizácia čipov, mnohojadrové procesory atď.) a pokroku na poli softvéru (napríklad stĺpcové ukladanie dát, dátová kompresia alebo partitioning). Výsledkom je zlomok času potrebný na dosiahnutie rovnakého efektu v porovnaní s predchádzajúcimi riešeniami. Dôležitý aspekt in-memory technológie je aj vysoká flexibilita pri zmenách a úpravách dátových modelov. Všetko je totiž uložené v pamäti, a tak netreba rešpektovať klasické vrstvy dátového skladu ani neustále kopírovať dáta. Všetky dátové modely a úpravy sú virtuálne. In-memory technológie sa často kombinujú aj s distribuovanými systémami typu Hadoop, ktoré slúžia na lacnejšie ukladanie menej používaných dát.


Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

ITPro

Made in Slovakia / Predstavujeme zaujímavé produkty, projekty a startupy

14.07.2019 10:53

Už takmer rok uverejňujeme v tejto rubrike úspešné IT produkty a IT projekty, semifinalistov súťaže z roku 2018, ktorej vyhodnotenie sa uskutočnilo vlani na jeseň na slávnostnom večeri IT GALA 2018. V ...

ITPro

Praktická kryptológia (26. časť) / Hašovacie nástroje

15.07.2019 10:49

V tejto časti seriálu vám v stručnosti predstavíme dva známe a veľmi často používané kryptografické nástroje, ktoré okrem iného ponúkajú možnosť výpočtu resumé správ, resp. hašov. Prvý z nich je robus ...

ITPro

Linux súkromne i pracovne v2.0 (41. časť) / Git branching a merging

14.07.2019 10:45

V tejto časti seriálu doplníme základné informácie týkajúce sa systému git o časti, ktoré majú súvis s aplikáciou vetvenia a spájania vývojových vetiev (línií). Budeme sa venovať obsahu git repozitáro ...

q

Žiadne komentáre

Vyhľadávanie

Najnovšie videá