SAMSUNG 042024 Advertisement SAMSUNG 042024 Advertisement SAMSUNG 042024 Advertisement

Kto bude novým kráľom videokodekov?

Archív NXT
0

Formáty videokompresií sú akousi sivou eminenciou na pozadí masívne rozšíreného digitálneho videa. Bežní používatelia, reprezentovaní konzumentmi obsahu, vedia o nich zvyčajne len málo, zatiaľ čo pre tých skúsenejších, ktorí videá vytvárajú alebo šíria, ide o niečo veľmi zaujímavé. O aktuálnom lídrovi na poli videokompresií H.264 zrejme nie je pochýb, ale situácia sa už onedlho môže zmeniť. Kto bude tomuto odvetviu vládnuť v druhej polovici tohto desaťročia?

Jeden z hlavných hnacích prvkov na používanie výkonnejších komprimačných algoritmov videa je neustále zlepšovanie zobrazovacích zariadení. Full HD rozlíšenia sú dávno bežná záležitosť nielen na veľkých TV a monitoroch, ale aj na drobných displejoch tabletov a smartfónov. Moderný trend zvyšovania rozlíšenia pritom neustupuje a na najvyšších triedach televízorov sa už začína objavovať štvornásobný počet zobrazovacích bodov (4K Ultra HD - 3840 × 2160). Dopyt po nových a stále výkonnejších komprimačných formátoch len tak ľahko nezmizne. Potrebné sú pritom nielen pre klasické digitálne „off-line" videosúbory, ale hlavne pre webové videoportály. Najpopulárnejšie servery YouTube a Vimeo transportujú každú sekundu enormné množstvá dát, pričom ich celkový objem sa každým dňom stupňuje. Rozmach HD videí a vysokorýchlostných internetových pripojení cítiť stále viac, a preto sa nemožno čudovať snahám o dosiahnutie maximálneho zníženia dátových tokov videa pri čo najmenšej strate obrazovej kvality.

Na lepšiu orientáciu v článku nezaškodí zopakovať si názvoslovie, ktoré je pre mnohých mätúce. V skutočnosti je však jednoduché a skladá sa len z troch prvkov - kompresný formát, kodek a kontajner. Kompresný formát je opis alebo skôr norma nejakého druhu kompresie videa, audia či iného obsahu. Typický kompresný formát videa je napríklad MPEG-2 či MPEG-4, zatiaľ čo pri hudbe napríklad MP3 či WMA. Kodek je softvér alebo hardvér (kodér-dekodér), ktorý podľa konkrétneho štandardu komprimuje alebo dekomprimuje cieľové dáta. Kodekom je napríklad Xvid (videokodek), ktorý používa kompresný formát MPEG-4, alebo Lame (audiokodek), ktorý používa kompresný formát MP3. Vďaka nim vzniká samostatná videostopa a samostatná zvuková stopa (obe skomprimované kodekom na základe nejakého formátu), ktoré sa umiestnia do spoločného multimediálneho kontajnera, ako je napríklad AVI alebo MKV.

Časy, keď internetovým videám vládli kodeky DivX a Xvid, založené na formáte MPEG-4 (Part 2 - ASP), sú dávno preč. Spolu s nimi sa pomaly poberá do internetovej histórie aj legendárny kontajner AVI, ktorý sa pre mnohých stal označením prípony videosúboru. Súčasnému svetu videokompresií vládne predovšetkým H.264 (MPEG-4 Part 10), ktorý je známy aj vďaka mimoriadne populárnemu open source kodeku x264. Vzhľadom na to, že tento kodek dnes takmer výhradne používa aj celá pirátska scéna, internet je zaplavený filmami a seriálmi vo formáte H.264. Video v tejto kompresii je zvyčajne umiestňované do multimediálnych kontajnerov MKV alebo MP4 (ktoré tvoria koncovku výsledného súboru), kde sa balí spoločne so zvukovou stopou vo formátoch MP3, AAC či AC-3. Na formáte H.264 je však postavených mnoho ďalších kodekov a tieto kompresie nájdeme napríklad aj vo filmoch distribuovaných na Blu-ray diskoch či na mnohých internetových video ortáloch. Vzhľadom na veľkú rozšírenosť formátu H.264 a multimediálnych kontajnerov MKV či MP4 nechýba podpora ich prehrávania ani na smartfónoch, tabletoch či televízoroch.

Formát H.264 (označovaný aj ako MPEG-4 AVC) je výsledkom spoločného úsilia dvoch významných vývojových skupín - VCEG (Video Coding Experts Group) a MPEG (Moving Picture Experts Group). Mnoho expertov ho v rámci dlhodobo zavedených formátov považuje za aktuálnu špičku. S malým odstupom sa do „prvej ligy" súčasných videokompresných formátov dá zaradiť ešte aj VP8, ktorý vyvinula spoločnosť On2 Technologies, a VC-1, vyvinutý spoločnosťou Microsoft. VP8 je nasadzovaný napríklad na YouTube, kde je obyčajne spoločne so zvukovou stopov vo formáte Vorbis umiestňovaný do multimediálneho kontajnera WebM. Na videoformát VC-1 zasa najčastejšie narazíte na filmových Blu-ray diskoch, kde je spolu rôznymi zvukovými formátmi umiestňovaný do kontajnera BDAV s koncovkou m2ts. Medzi formáty, ktoré pomaly strácajú na význame a ktoré sa už vzhľadom na svoje schopnosti a vek dajú zaradiť do „druhej ligy" videokompresií, patrí napríklad H.262/MPEG-2 Part 2 (slávny najmä vďaka diskom DVD video), H.263/MPEG-4 Part 2 (známy vďaka kodekom Xvid a DivX), Theora (často používaný spoločne s kontajnerom Ogg) či Dirac.

Graf.png

Zvyšovanie účinnosti kompresie za posledné desaťročie

Nové dravce na scéne - H.265 a VP9

Situácia na poli videokompresných formátov sa však začína meniť. V priebehu tohto roka Google predstavil novú generáciu svojho formátu s označením VP9, s ktorou sa chystá bojovať počas nasledujúcich rokov. VP9 vychádza z aktuálneho formátu VP8, pričom prináša niekoľko nových zlepšení, ako sú napríklad nové predikčné módy a transformácie alebo podpora superblokov s veľkosťou 32 × 32 pixelov. Úlohou novej generácie algoritmu je dosiahnutie približne polovičného dátového toku v porovnaní so súčasnými riešeniami pri zachovaní rovnakej obrazovej kvality. Ide predovšetkým o videá vo vysokých rozlíšeniach (720p, 1080p a viac), ktoré používajú dátový tok v jednotkách či desiatkach Mbit/s. Pre Google sú výkonné kompresné formáty mimoriadne dôležitá oblasť vývoja. Na jeho servery YouTube nahrajú ľudia okolo 100 hodín videa každú minútu a počas mesiaca sa prehrá viac ako šesť miliárd hodín záznamu. Keďže tieto čísla neustále stúpajú, výkonnejšie kompresné formáty môžu ušetriť skutočne masívne objemy internetového dátového toku a diskového priestoru. Tieto čísla sú, samozrejme, v priamej súvislosti s nákladmi na prevádzku, a preto nie je čudné, že Google v roku 2010 neváhal formát VP8 kúpiť spoločne s jeho vývojovou spoločnosťou (On2 Technologies) za 123 miliónov dolárov.

Konečná špecifikácia formátu VP9 (konkrétne jeho prvého profilu s označením 0) bola uvoľnená v júni tohto roka. Hneď v auguste sa pritom dočkala implementácie dekodéra do prehliadača Google Chrome (verzia 29.0.1547) s experimentálnym použitím VP9 na niektorých videách YouTube (kanál WebMVP9). Aj keď Google jednoznačne má prostriedky na to, aby formát rýchlo začal presadzovať, jeho cesta môže byť tŕnistá. Stačí sa len pozrieť na VP8, ktorý sa nedokázal proti H.264/MPEG-4 AVC výrazne presadiť ani po troch rokoch. Je však pravda, že VP8 ťahal za kratší koniec aj z technologickej stránky. Tomu by mal byť v prípade VP9 koniec. V súčasnosti sú síce kodeky pre VP9 ešte v raných štádiách, ale v konečnom dôsledku by mal konkurenta v podobe H.264 nechať v budúcnosti za sebou. To však nebude jeho jediný súper. V priebehu tohto roka bol totiž publikovaný aj finálny štandard formátu H.265.

HEVC-analyser.png

Kódovací strom na snímke videa vo formáte H.265

H.265 (MPEG-H Part 2) je videokompresný formát vyvinutý skupinami Video Coding Experts Group a Moving Picture Experts Group. Označovaný je aj ako HEVC, čo je skratka pre vysoko efektívne kódovanie videa (High Efficiency Video Coding). Ide o priameho nástupcu H.264, pričom jeho hlavným cieľom je dosiahnuť polovičný dátový tok pri zachovaní rovnakej kvality videa. Ide teda o rovnaký cieľ ako v prípade konkurencie v podobe VP8/VP9. Formát H.265 je zrejme najvýznamnejším predstaviteľom nadchádzajúcej generácie kompresií, pripravených na videoobsah v extrémne vysokých rozlíšeniach. Ten bude v druhej polovici tohto desaťročia celkom určite naberať na význame, počínajúc rozširovaním 4K Ultra HD zariadení.

Podobne ako H.264 a iné videokompresie aj H.265/HEVC používa tri typy snímok (snímky I, B a P), pričom uplatňuje kompresie intra-frame (kompresia I snímok nezávislá od okolitých snímok) a inter-frame (zisťujú sa rozdiely medzi snímkami a ukladá sa len tá časť, ktorá sa mení). Oproti svojmu predchodcovi však zavádza množstvo pokročilých metód a zmien, pričom medzi tie najvýznamnejšie patrí kódovací strom blokov a rozšírenie smerov intrapredikcie. Zatiaľ čo pri kompresii postavenej na aktuálnom formáte H.264 dochádza k rozdeleniu snímky do malých štvorcov (v maximálnej veľkosti 16 × 16 pixelov), označovaných ako makrobloky, pri H.265 sa na efektívnu prácu s Ultra HD obsahom používa kódovací strom, pri ktorom maximálny rozmer bloku môže narásť až do veľkosti 64 × 64 pixelov. Vďaka tomu možno v špecifických častiach snímok ušetriť veľký dátový objem.

Počet možných smerov pri intrapredikcii bol pri H.265 rozšírený z 9 na 35 a pridaná bola aj adaptívna predikcia pohybových vektorov. Ide o významné rozšírenie sily kompresie. Bloky sa pri ňom podrobnejšie analyzujú, pričom sa hľadajú také, ktoré sú vzájomne veľmi podobné. Typicky ide napríklad o oblohu, stenu či inú súvislú časť. Nejde pritom iba o snahu nájsť rovnaké bloky, ktoré sú v rámci snímok statické, ale aj tie, ktoré menia svoju polohu. Algoritmus odhaľuje pohyby jednotlivých blokov, takže pokiaľ sa blok pixelov, ktorý má rovnakú farbu a svetlosť, vyskytuje vo viacerých snímkach, ale mení svoju polohu, možno jeho obrazové dáta uložiť len raz. Pokročilá smerová predikcia tak výrazne zvyšuje efektívnosť kompresie bez straty kvality, no na druhej strane zvyšuje hardvérovú náročnosť. To sa však pri moderných kompresiách, od ktorých vyžadujeme extrémne vysokú kvalitu pri nízkych dátových objemoch, dá očakávať. Okrem už spomenutých postupov je ďalšou vnútornou zmenou H.265 napríklad aj významné zlepšenie potláčania artefaktov spôsobených kvantovaním a blokovými procesmi vďaka aplikovaniu doplnkového filtra (Sample Adaptive Offset).

Z laického hľadiska prináša H.265 hlavne podporu vysokého rozlíšenia, a to až do 8K Ultra HD (8192 × 4320 bodov) a zvýšený limit maximálnej snímkovej frekvencie, ktorý stúpol oproti H.264 zo 60 až na 300 snímok za sekundu.

Rozlisenie.jpg

Porovnanie počtu bodov Full HD rozlíšenia oproti Ultra HD

Nasadenie novej generácie formátov

Po dokončení špecifikácií jednotlivých formátov v priebehu tohto roka sa pozornosť obracia na pokroky v oblasti kodekov. Na úspešné rozšírenie treba vyvinúť čo najúčinnejší softvér na kódovanie a dekodóvanie, ktorý umožní bezproblémové použitie nového kompresného formátu. Výzvou je najmä optimalizácia. Do pozornosti sa určite dostane efektivita z hľadiska viacvláknového spracovania na CPU počítačov aj mobilných zariadení a akcelerácia GPU.

Medzi významných vývojárov kodeku pre H.265 patrí napríklad spoločnosť Docomo, ktorá ešte pred dokončením finálnych špecifikácií formátu predviedla kompresiu vysokokvalitného videa v rozlíšení 4K Ultra HD (so 60 snímkami za sekundu) pri dátovom toku 10 Mbit/s. Okrem komerčných riešení sa však pozornosť zameriava aj na open source riešenia, ako je projekt x265. Práve ten sa dá považovať za nástupcu aktuálneho otvoreného kodeku x264 (ktorý patrí v rámci formátu H.264 k úplnej špičke, a to nielen z hľadiska nekomerčných, ale aj komerčných kodekov), pričom z jeho zdrojového kódu priamo vychádza. V súčasnosti je x265 ešte v ranom štádiu vývoja (od marca tohto roka) a do obrovskej komplexnosti kodeku x264 mu chýba ešte poriadny kus cesty. Pokroky v jeho vývoji môžete sledovať na stránke http://x265.org.

Rozšírenie novej generácie formátov v podobe VP9 a hlavne H.265 (HEVC) bude v nasledujúcich rokoch zrejme pozvoľné. Treba si uvedomiť, že sila moderných formátov vynikne najmä v súvislosti s vysokými rozlíšeniami. Ich chvíľa teda príde s nárastom používania 4K a hlavne 8K Ultra HD, pre ktoré sú aktuálne technológie jednoducho nevhodné (dátový tok je pri nich priveľký). Dá sa teda očakávať, že v priebehu druhej polovice tohto desaťročia budú práve formáty H.265 a VP9 tým najpoužívanejším riešením a preberú žezlo po aktuálnom kráľovi.

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať