Image
4.9.2017 0 Comments

Piql: bezpečná archivácia údajov s trvanlivosťou min. 500 rokov

Digitalizácia je úžasná vec s úžasnými možnosťami, ale zamysleli ste sa nad spôsobom dlhodobej archivácie údajov? Zaistiť prístup k dnešným digitálnym dátam v budúcnosti je veľká výzva. A komplexnosť tohto problému navyše narastá s exponenciálne rastúcim objemom údajov.

Poučme sa z nedávnej histórie

Skúste zaloviť v pamäti, ako ste s nadšením kupovali nové stále modernejšie médiá na ukladanie údajov s čoraz vyššou kapacitou. Najskôr to boli 8", neskôr 5,25" diskety v ohybnom plastovom obale. Tie následne úplne vytlačili moderné 3,5" diskety v pevnom plastovom obale. Ich kapacita 1,44 MB však veľmi rýchlo prestala stačiť a nastalo krátke bezvládie, čo sa týka štandardov. Bolo to obdobie, keď sa hľadala náhrada za diskety a rôzni výrobcovia sa snažili presadiť rôznymi konštrukciami prepisovateľných médií typu ZIP, JAZZ a podobne. Napokon sa stalo de facto štandardom ukladanie údajov na zapisovateľné a prepisovateľné CD a DVD médiá. Skúsili ste čítať údaje z prvých CD-R, ktoré vstúpili do komerčného štádia v roku 1988? Určite by sa vám to podarilo, tieto médiá boli veľmi kvalitné a zároveň veľmi drahé. Potom však kvalita ustúpila požiadavke na čo najnižšiu cenu a z bežných lacných médií po roku 1995 by ste dnes – po vyše 20 rokoch – už všetky údaje zrejme neprečítali. Možno z archívnych diskov, ktoré sú však niekoľkonásobne drahšie ako štandardné. Alebo iný rébus. Čo by ste urobili, keby sa vám dostalo do ruky médium typu ZIP alebo JAZZ, využívajúce podobne ako pevný disk jednu alebo viac kovových platní? Ako by ste sa dostali k údajom na takomto médiu, aj keby ste vedeli, že sú veľmi dôležité? Zohnať príslušné zariadenie vo funkčnom stave je už teraz veľmi ťažké. A čo o 20 či 50 rokov? Ak to zosumarizujeme, potrebujeme spôsob, ako uchovať digitálne údaje na stovky rokov a ako k nim v budúcnosti získať prístup, keď prístroje, pomocou ktorých boli tieto dáta zaznamenávané, nájdeme iba v múzeách, ak vôbec.

Uchovávanie na fyzických médiách

Ak archeológovia nájdu nejaký dokument, či už na papyruse, pergamene, papieri, alebo vytesaný do kameňa, dokážu s ním pracovať, prečítať ho a rozlúštiť jeho kódovanie, teda znakovú abecedu. Z tejto analógie vyplýva nielen to, že dôležité dokumenty a údaje by sa mali ukladané na osvedčené fyzické médiá, ale mali by byť buď priamo čitateľné človekom, alebo v prípade, ak sú kódované, malo by archívne médium obsahovať definíciu kódu, a to v podobe čitateľnej pre človeka.

Do kategórie fyzických médií patria, samozrejme, aj magnetické pásky, diskety či disky, no tie strácajú časom svoje vlastnosti a navyše sú veľmi citlivé na vonkajšie vplyvy, napríklad na magnetické pole, teplotu a podobne. Naproti tomu optický záznam na kvalitnom filme má oveľa dlhšiu životnosť. Fotografický film sa začal používať v roku 1868, takže táto metóda je časom dôkladne preverená. Záznam na film má aj veľa ďalších výhodných vlastností. Dá sa predpokladať, že zariadenia na projekciu a zväčšenie budú k dispozícii vždy, takže na film sa dajú ukladať buď priamo snímky dôležitých dokumentov, alebo aj digitálne údaje s použitím vhodného kódovania využívajúceho svetlé a tmavé plôšky na podobnom princípe ako populárne QR kódy. Kľúčová výhoda filmu je aj v tom, že ide o médium bez možnosti prepisovania, takže raz zapísané údaje sú nemenné.

Problémy a hľadanie riešení

Ak ste sa zamysleli nad scenárom z predchádzajúcej state, teda že by ste potrebovali prečítať dôležité údaje z netypického či zastaraného média, takáto situácia je skôr výnimka než pravidlo. Dôvodom je priebežná migrácia. Údaje z diskiet, aspoň tie dôležité, totiž boli postupne ukladané na novšie médiá, napríklad na CD-R alebo DVD-R, prípadne na pásky či disky. Periodicita priebežnej migrácie je v závislosti od typu archívneho média zhruba 4 až 8 rokov. Priebežná migrácia sa však s exponenciálnym nárastom údajov stáva čoraz náročnejšou. Preto by bolo výhodné ukladať skutočne dôležité údaje a tých nebýva až tak veľa na definitívnom médiu, určenom na dlhodobé uskladnenie. Ak to zhrnieme, najväčšie problémy archivácie údajov sú životnosť dátových úložísk, zastarávanie čítacích zariadení a ich vyraďovanie z prevádzky a predovšetkým meniace sa médiá na ukladanie a meniace sa formáty dátových súborov. Preto dôležité údaje ukladáme na viacerých miestach, viacerými spôsobmi a priebežne migrujeme a obnovujeme dáta každých 3 až 5 rokov.

Modelové situácie

Určite ste počuli o takzvaných časových puzdrách, do ktorých sa uložia rôzne predmety z daného obdobia, puzdro sa dôkladne uzavrie a uloží na bezpečné miesto s predpokladom, že sa otvorí o 50, 100, prípadne viac rokov. S časovými puzdrami z analógovej éry nebude žiadny problém, možno technikov trochu potrápi prehranie zvuku z gramoplatne, ale to nie je nič, čo by inžinier nevyriešil. Naproti tomu s časovými puzdrami z digitálnej éry sú problémy. Dobrý príklad je veľký multimediálny projekt The BBC Domesday Project. Cieľom bolo vytvoriť záznam o živote Britov v 80. rokoch 20. storočia. Už po 15 rokoch nebolo možné informácie v rámci projektu prečítať. Alebo iný príklad: archivované údaje z prvej úspešnej misie na Mars v roku 1975. V roku 1990 tieto dáta uložené na dobových médiách už NASA nedokázala prečítať. Našťastie niekomu skeptickému vtedy napadlo údaje aj vytlačiť, a tak NASA mohla obnoviť stratené dáta z vytlačených papierov. A ešte jedna prognóza: v priebehu 20 rokov zmizne 80 % vedeckých dát z dôvodu zastaraného dátového úložiska.

Archivačný systém Piql

Film je nezameniteľné, bezpečné a rokmi otestované fyzické médium so životnosťou minimálne 500 rokov. Údaje v systéme Piql sa môžu ukladať v digitálnom formáte ako plôšky na filme, predstavujúce jednotky a nuly údajov v binárnej sústave. Takýmto spôsobom sa na film uloží veľké množstvo údajov, no tie bude treba pri čítaní dekódovať. Údaje sa fyzicky ukladajú na 35 mm archívny film s trojitou perforáciou s dĺžkou 945 m. Formát ukladania dát na filme používa štandardné algoritmy na opravy chýb pre digitálne technológie na ukladanie dát. Na zapisovanie sa využíva zobrazovací senzor Texas Instruments DLP s rozlíšením 4K (4096 × 2160 pixelov), ktorý sa skladá z viac ako 8 miliónov mikrozrkadiel, schopných zapísať pixely vo veľkosti 6 μm. Zápis sa uskutočňuje rýchlosťou 24 snímok za sekundu a umožňuje zápis dát rýchlosťou 40 Mbit/s. Požadované rozlíšenie skenera je 12K, číta sa rýchlosťou 2,7 snímky za sekundu – 5 Mbit/s.


Ukladanie v digitálnom formáte

Druhá možnosť je vizuálny formát, pri ktorom sa údaje ukladajú vo forme čitateľnej pre ľudí. Je to de facto ekvivalent mikrofilmu, takže na prečítanie dokumentu stačí čítacie zariadenie so zložitosťou detskej premietačky. Kombináciou týchto metód vznikne hybridný formát. Formát filmu je navrhnutý tak, aby obsahoval návod čitateľný aj ľudským okom, podrobne vysvetľujúci, ako získať dáta z filmu, a to vrátane definície dátových formátov. Definícia formátov je open source, teda každému dostupná. Dáta sú ľahko prístupné, vyhľadávanie je vďaka metadátam rýchle a bezproblémové.

Film je uložený v odolnom polymérovom obale piqlBox, ktorý má takisto životnosť minimálne 500 rokov. Obal je navrhnutý tak, aby s ním mohli manipulovať manuálne aj automatické skladové systémy. K dispozícii je automatický skladový systém piqlVault. Ďalšia výhoda archivačného systému Piql je okrem trvanlivosti aj bezpečnosť, údaje na filme sa už nikdy nedajú prepísať, takže sú stopercentne zabezpečené proti hackingu.


Piql box na uloženie filmu

Ako to funguje? Zákazník dodá svoje digitálne dáta v akomkoľvek formáte a spoločnosť Piql ich zapíše na film. Údaje na filme si odnesiete alebo ich bezpečne uložíte u poskytovateľa služby.


Zariadenie na zápis a čítanie

Architektúra systému Piql

Systém pozostáva z piatich hlavných komponentov: Process Manager (mozog systému), piqlWriter (filmová napaľovačka), piqlProcessor (filmový procesor), piqlReader (filmový skener) a z operátorského rozhrania. Toto riešenie možno ľahko integrovať s Warehouse Management Systemom, ktorý je vhodný na skladovanie médií.

Odolné proti budúcnosti

Podobne ako analógová gramoplatňa sú aj údaje uložené na filmoch v archívnom systéme Piql nezávislé od budúceho vývoja. Bez ohľadu na to, či ľudstvo za budúcich 500 rokov dosiahne pokrok, o ktorom sa nám dnes ani len nesníva, alebo po nejakej katastrofe sa vývoj vráti o niekoľko storočí, údaje z filmu, aspoň tie vizuálne, bude možné prečítať aj s technológiou na úrovni roku 1900. Všetky informácie potrebné na načítanie dát sú uložené v ľudsky čitateľnom formáte na začiatku každej cievky. Ak sa stane, že niekedy v budúcnosti softvér už nebude k dispozícii, ktokoľvek bude môcť vytvoriť nový softvér s minimálnym úsilím za využitia informácií na filme. Textové informácie nie sú problém, čo sa týka multimédií, je na zákazníkovi, aký formát si zvolí. Toto môže byť zdanlivo určité úskalie, či bude niekto schopný o 500 rokov spracovať dnes bežné formáty ako PDF, JPFG či MP3. Sú to však natoľko rozšírené formáty, že ich opis sa určite zachová.

 

 

Zobrazit Galériu

Nechajte si posielať prehľad najdôležitejších správ emailom

Mohlo by Vás zaujímať

ITPro

Praktická kryptológia (17. časť): Šifrovanie diskových oblastí

19.09.2018 22:35

Tento článok bude voľným pokračovaním predošlej časti seriálu, v ktorej sme sa venovali šifrovaniu pevných diskov. Zameriame sa na niektoré významné detaily a uvedieme význam nástrojov a procedúr, kto ...

ITPro

Zabezpečenie objektu – odporúčania

19.09.2018 22:27

Vo voľnej sérii článkov sa venujeme rôznym aspektom zabezpečenia objektov. Môžu to byť veľké objekty, napríklad areály firiem či logistických skladov, alebo budovy malých firiem, prípadne rodinných fi ...

ITPro

Smart parking: Jednoduchá technológia, z ktorej profitujú všetci

12.07.2018 10:12

Siete pre internet vecí v súčasnosti ponúkajú množstvo riešení na uľahčenie každodenného života. Jeden z najväčších problémov obyvateľov miest je bezpochyby parkovanie. Predstavte si situáciu, keď vie ...

q

Žiadne komentáre

Vyhľadávanie

IWAYDAY_2018

Najnovšie videáPC forum button