Image
16.1.2013 0 Comments

Nový program je schopný identifikovať anonymných autorov

29c3.jpg Hackerská konferencia ukázala, že len 20 percent anonymných autorov sa oprávnene cíti v bezpečí.

Na hackerskej konferencii Chaos Communication Congress 29C3 skupina amerických lingvistov z univerzity v Drexeli predstavila svoj výtvor Anonymouth - program schopný určovať autora textových príspevkov na základe porovnávania textov. Podľa autorov možno až 80 percent používateľov niektorých anonymných diskusných fór nájsť pomocou lingvistiky.

Stylometrická analýza používa štatistické metódy v snahe o identifikáciu alebo potvrdenie autorstva analyzovaného textu. Vyžaduje na to rozsiahlu vzorku textov, kde sú autori známi a dá sa analyzovať ich použitá slovná zásoba, frekvencia jednotlivých slov, dĺžka a spôsob skladby jednotlivých viet a pod. Nejde teda o vlastný obsah oznámenia, ale o jeho formu - pri každom autorovi je veľmi pravdepodobné, že rovnakým spôsobom uplatňuje tzv. funkčné slová (ako spojky, zámená, pomocné slovesá, ktoré majú minimálny lexikálny význam, ale určujú gramatické vzťahy v súvetiach) napríklad vo svojej dizertačnej práci aj v každom diskusnom príspevku. Výskumníci tieto techniky aplikovali na milióny príspevkov od desiatok tisíc používateľov, ktoré boli zaslané do niekoľkých viacjazyčných webov podzemných hnutí.

Predvádzaný program, ktorý je zatiaľ označovaný za alfa verziu (možno ho stiahnuť na príslušných stránkach univerzity), má množstvo obmedzení. Analýza potrebuje minimálne 5000 slov príspevkov na autora. Ďalej je nevyhnutné oddeliť diskusie od „produktových" informácií (ako sú kreditné karty, vírusy atď.) od konverzačných textov, aby bola umelá inteligencia schopná pracovať samostatne. Finálna analýza prebieha iba v angličtine a všetky texty sú preložené pomocou voľne dostupných nástrojov, ako je Google alebo Bing.

Autori zdôrazňujú, že pri spojení s profesionálnym prekladovými prostriedkami, prípadne preučením programu na danú jazykovú oblasť pravdepodobnosť identifikácie pôvodu príspevku ďalej vzrastie. Ďalšie verzie programu majú navyše brať do úvahy aj iné informácie, ako skupiny adries IP, z ktorých príspevok pochádza, či v akých časoch a z akých časových zón pochádza.

Takéto nástroje môžu odhaliť vlastníkov botnetových sietí i autorov malvéru, čo určite zaujme veľa štátnych organizácií. Na opačnej strane však nepochybne povedú k ďalšej minimalizácii anonymity na internete a k následnému ohrozeniu slobody prejavu, a to nielen v diktátorských režimoch sveta.

Zdroj: computerworld.cz


Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

Produkty

Dizajnér navrhol nábytok, ktorý sa poskladá sám

20.01.2017 00:05

Máte problém s dopravou či montážou novozakúpeného nábytku? Mladému dizajnérovi sa podarilo tento problém vyriešiť. Plocho balený nábytok uľahčuje prepravu, keď však príde na jeho montáž, zostávajú m ...

Produkty

Rozmery Samsung Galaxy S8 a S8 Plus naznačujú, že pôjde o takmer bezrámčekové telefóny s veľkými displejmi

20.01.2017 00:30

Väčšia verzia nového vlajkového modelu Samsungu Galaxy S8 Plus bude mať rozmery 152,38 × 78,51 × 7,94 mm. Tvrdí to web  GSM Arena na základe 3D renderov, ktoré získal od výrobcu krytov. Bude teda vyšš ...

Produkty

Začína sa nová séria rýchlostných pretekov elektromobilov. Upravená Tesla vraj zrýchli z 0 na 100 km/h za 2,1 s

20.01.2017 00:20

Vlani usporiadatelia ohlásili popri Formule E, najznámejších pretekoch elektromobilov, aj novú sériu Electric GT Championship. Ako pretekárske auto sa v nej použije Tesla Model S P100D. Ide o uprave ...

Žiadne komentáre

Vyhľadávanie

ITSMF jar

Najnovšie videá