4.3.2016 0 Comments

IT Pro: Analýza sentimentu

Biznis je popri objektívnych faktoroch do značnej miery závislý aj od nálad zákazníkov, obchodných partnerov či dodávateľov. Nálady a postoje zúčastnených ovplyvňujú napríklad prijatie produktov a služieb za stanovené ceny. Analýza nálad sa čoraz viac využíva aj na spresňovanie prediktívnych analýz.

Pod pojmom sentiment rozumieme subjektívne, psychicky a sociálne podmienené, viac alebo menej pozitívne prejavy vôle, bezprostredné hnutia mysle, náklonnosť alebo odpor, ktoré nezávisia od rozumovej úvahy. Dôsledkom môže byť kladný alebo záporný postoj, ktorý môže byť aj trvalý a nepodlieha úplne vedomej kontrole. Na základe individuálnych postojov potom ľudia obhajujú svoje názory a riešia dilemy. Pre biznis sú kľúčové dilemy typu „kúpiť alebo nekúpiť“, prípadne „uzavrieť alebo neuzavrieť dohodu“.

Pri zisťovaní nálad je dôležité analyzovať súhrn aktivít ľudí pozostávajúci z príspevkov a diskusií na sociálnych sieťach, hodnotenia produktov a služieb buď na stránkach dodávateľov, alebo v diskusných fórach a ďalších platformách umožňujúcich vyjadrenie názoru. Všetky aktivity sú v prirodzenom jazyku.  Úlohou analýzy sentimentu nie je vyťažovanie konkrétnych faktov, ale zisťovanie subjektívneho kontextu textov a postoja pisateľa textu k skúmanej téme. Primárna úloha je analýza, či skúmaný text nejaký názor alebo postoj vôbec obsahuje. Ak áno, vykoná sa automatická kvantifikácia subjektívneho obsahu vyjadreného v textovej podobe. Z hľadiska kategorizácie sa analýza sentimentu zaraďuje do oblasti NLP (natural language processing), teda spracovania prirodzeného jazyka. Aby sa tieto analýzy odlíšili od data miningu, často sa označujú aj ako dolovanie v názoroch (opinion mining).

Analýza sentimentu z neštruktúrovaných textov pochádzajúcich z heterogénnych zdrojov je veľmi náročná a dosiaľ nedosiahla úroveň zrelosti. Stále nie sú k dispozícii dostatočne výkonné a sofistikované nástroje, ktoré by zvládali skúmanie subjektívneho kontextu univerzálne na požadovanej úrovni, ani pre angličtinu, o češtine a slovenčine ani nehovoriac. Pre súčasné nástroje je dôležité spracúvať dostatočne veľké vzorky údajov, aby sa chybovosť minimalizovala.

Ako to funguje

Princíp fungovania analýzy sentimentu najlepšie objasníme na jednoduchom príklade. Použijeme text z hodnotenia tabletu:

... iPad Mini tretej generácie má excelentný displej, dobrý dizajn a kvalitné mechanické vyhotovenie. Vzhľadom na rozmery a hrúbkumá pomerne dlhú výdrž na batériu. Žiaľ, v porovnaní s iPadom Air 2 nedisponuje procesorom A8X a má aj nižšie rozlíšenie prednej kamery ...

Výsledkom analýzy textu v prirodzenom jazyku budú štruktúrované údaje v tvare:

<subject id= "Y10">

   <attribute name="display" value="+2"/>

   <attribute name="design" value="+1"/>

   <attribute name="battery" value="+1"/>

   <attribute name="processor" value="-2" />

   <attribute name="camera" value="-1" />

</subject>

Analýza sa realizuje v dvoch etapách, ktoré sa môžu uskutočňovať aj paralelne. V prvej etape sa rozpoznávajú pomenované entity vzhľadom na relevantné objekty a ich atribúty. Dôležitá je identifikácia atribútov s najvyššou informačnou hodnotou vzhľadom na danú klasifikačnú úlohu. Ak je atribútov priveľa, automaticky sa redukujú pomocou korelácie. V druhej etape nasleduje analýza nálad z kontextu viet anotovaných v rámci predošlého kroku.

Pri analýze sa využívajú rôzne pravidlá a slovníky, najmä slovníky pozitívnych a negatívnych výrazov, slovníky výrazov meniacich orientáciu hodnotenia, odhaľovanie sarkazmov či slovníky slov meniacich intenzitu hodnotenia. Prevládajúci problém sú rôzne aspekty správania ľudí, hlavne irónia. Nie vždy je jednoduché rozpoznať, či ide o pozitívny alebo negatívny názor. Niektoré vety totiž obsahujú zároveň pozitívny a negatívny názor. Napríklad: „Šampón xy je perfektný na umývanie okien.“ Preto zložitejšie nástroje využívajú výpočtovo veľmi náročné multivariantné metódy, ktoré zohľadňujú vzťahy medzi atribútmi. Využívajú sa pri tom rôzne heuristické metódy, slovníky a  samoučiace procesy. Heuristika sa zameriava hlavne na spoločný výskyt slov vo frázach, kde je predpoklad, že tieto pojmy navzájom súvisia. Takisto výskyt v textoch z rovnakého zdroja dáva tušiť, že pojmy sa viažu na podobnú problematiku. Skúma sa aj vzdialenosť pojmov v texte.

Oblasti nasadenia

Analýza sentimentu sa využíva hlavne sa v oblastiach, kde je k dispozícii veľké množstvo subjektívnych hodnotení. Prevládajú segmenty, kde možno zistiť merateľný vplyv hodnotení spotrebného tovaru, komunikácií a mediálnej zábavy a podobne.  Zisťujú sa nálady, pocity a postoje k značke, ku konkrétnemu produktu či službe. Analýzy nálad sa často kombinujú s inými typmi analýz. Typický príklad je identifikácia prirodzených lídrov, ktorí usmerňujú diskusie, aby ich mohlo oddelenie starostlivosti o zákazníkov prioritne riešiť a ústretovým postojom sa pokúsilo o prípadné korigovanie ich postojov. Výsledky analýzy nálad poslúžia nielen na riadenie marketingovej stratégie a PR akcií na promovanie značky, ale aj na predikciu vývoja cien akcií na základe on-line hodnotení.

V poslednom čase sa analýza sentimentu čoraz viac využíva  ako doplnok prediktívnych analýz, predovšetkým na predpovedanie správania zákazníkov, na účely cieleného marketingu a analýzy názorov na značku, produkty či zákaznícky servis. Ak analýza signalizuje zmenu nálad zákazníkov, hlavne ak sa mení ekonomické prostredie, prípadne ak na trh vstúpil revolučný konkurenčný produkt, môže firma operatívne upraviť prediktívne modely. Synergia medzi obidvoma typmi analýz funguje aj opačne – prediktívne analýzy sa využívajú na identifikáciu atribútov na analýzu sentimentu.

V článku boli použité materiály nezávislej analytickej spoločnosti Gartner.

 

 


Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

ITPro

Linux súkromne i pracovne v2.0 (14. časť): Small Business Server

09.11.2016 14:57

Pojem Small Business Server (malý firemný server) začala používať spoločnosť Microsoft ešte v roku 2000 na označenie servera, ktorý ­dokázal plniť úlohy niekoľkých samostatných serverov. Aplikačná vrs ...

ITPro

Industry 4.0: Fikcia alebo už realita?

09.11.2016 14:52

Štvrtá priemyselná revolúcia je pomenovanie rozsiahlych zmien prudko vstupujúcich do súčasného priemyslu. Nositeľom týchto zmien je digitalizácia výroby a optimalizácia všetkých podnikových procesov v ...

ITPro

Vývoj aplikácií UWP pre Xbox One II.

09.11.2016 14:47

V predošlej časti sme ukázali postup, ako si ­vytvoriť vývojársky účet a aktivovať vývojársky režim na hernej konzole Xbox One, aby ste mohli testovať svoje aplikácie. Výhodou hernej konzoly Xbox je v ...

Žiadne komentáre

Vyhľadávanie

Kyocera - prve-zariadenia-formatu-a4-s-vykonom-a3

Najnovšie videá