Image
17.2.2014 0 Comments

Webové stránky plné čudných duchov

Kto je najčastejším návštevníkom webových stránok? Ak ste odpovedali nejakou špecifickou skupinou ľudí, mýlite sa. Internet dnes zapĺňajú predovšetkým roboty. Na rozdiel od svojich fyzických náprotivkov však nemajú kovové končatiny, ale pozostávajú z riadkov zdrojového kódu. Kódu určeného nielen na šľachetné účely, ale aj na generovanie podvodného zisku.Vštúdii vypracovanej spoločnosťou Incapsula, ktorá vpriebehu minulého roka zhromaždila dáta z20000 internetových stránok z249 štátov sveta, sa ukázalo, že takmer 62 % webovej návštevnosti tvoria automatické roboty. Ich účel je pritom rôzny – od mimoriadne užitočných „webových pavúkov“ až po atrapy vytvárajúce podvodné zisky na základe generovania falošnej návštevnosti. Zo štúdie vyplýva, že ľudskí návštevníci tvoria vpriemere len 38 % interakcií so stránkami. Oďalších 31 % sa starajú „dobré“ webové roboty, čo sú najmä autonómne indexovače, ktoré internetové vyhľadávače vypúšťajú do webovej pavučiny na tvorbu svojich stále aktuálnych databáz. Tu, samozrejme, nejde onič nezvyčajné. Sú toužitočné roboty, bez ktorých by sme internet nemohli efektívne používať. Problémom však je zostávajúcich 31 % celého koláča, predstavovaných automatickými mechanizmami spochybným účelom. Incapsula ich rozdelila do štyroch skupín: automatické zhromažďovače dát (Web scraping), útočné nástroje na odhaľovanie azneužívanie zraniteľností, spamovacie mechanizmy ana imitátorov.Zhromaždovače dát (5 %) či „webscrapery“ sú automatické nástroje na extrahovanie dát zwebových stránok. Ich činnosť sa vzáklade trochu podobá robotom na indexovanie webu pre vyhľadávače. Hlavný rozdiel je však v tom, že scrapery sa zameriavajú na transformáciu hrubých dát (bežný obsah stránky viditeľný čitateľom) na štruktúrované dáta, ktoré môžu byť uložené ahlavne analyzované vlokálnej databáze. Takýto zber môže byť neškodný, respektíve šľachetný, pričom sa dá spomenúť napríklad zber dát na akademický výskum zabehnutých mechanizmov, trendov či monitorovanie počasia. ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu PC REVUE, ktorý je dostupný pre predplatiteľov. S digitálnym predplatným za 20 € na celý rok získate neobmedzený prístup k uzamknutému obsahu na webe. Objednať si ho môžete TU. Ak už máte digitálne predplatné PC REVUE prihláste sa TU. Ak máte digitálne predplatné Piano, prihláste sa pomocou Piano.


Prihlásiť pomocou členstva PC REVUE
 
Alebo sa prihláste cez službu Piano





Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Archív PCR

Obsah PC REVUE 12/2016

08.12.2016 10:46

OBSAH DECEMBROVÉHO VYDANIA  MAGAZÍN Editorial Doprava budúcnosti smeruje do vzduchu Smart City/Inteligentné vyhľadávanie parkovacích miest Žijeme v simulácii vytvorenej počítačom inej civilizácie ...

Archív PCR

Kompletné vydanie PC REVUE 12/2016 vo formáte PDF

08.12.2016 09:45

Ak­tuál­ne PC RE­VUE 12/2016 v PDF na stiah­nu­tie pre či­ta­te­ľov. Hes­lo k chrá­ne­né­mu PDF sme Vám pos­la­li mai­lom.

Archív PCR

Obsah PC REVUE 11/2016

04.11.2016 15:07

OBSAH NOVEMBROVÉHO VYDANIA  MAGAZÍN■ Reportáž: IT GALA 2016■ Microsoft predstavil svoju 3D víziu a Surface Book■ Reportáž: Microsoft Ignite 2016■ Reportáž: Svetlo a tieň sa spojili■ Apple má nov ...

Vyhľadávanie

Kyocera - prve-zariadenia-formatu-a4-s-vykonom-a3

Najnovšie videá