GZIP i BZIP2

Anonim

GZIP vs BZIP2

GNU zip (također poznat kao GZIP) je softverska aplikacija s ciljem komprimiranja datoteka. Izvorno je bio namijenjen zamjeni komprimiranog programa koji se koristi u ranim Unix sustavima - koji će se koristiti u GNU projektu (besplatni softver).

BZIP2 je open source algoritam komprimiranja podataka bez gubitaka - u osnovi, klasa algoritama komprimiranja podataka koja omogućuje da se izvorni podaci komprimirane datoteke potpuno rekonstruiraju iz komprimiranih podataka.

GZIP se temelji na algoritmu poznat kao DEFLATE. Ovo je također algoritam za komprimiranje podataka bez gubitaka. Koristi i algoritam LZ77 i Huffman kodiranje. U osnovi, GZIP se odnosi na format datoteke istog naziva. Ovaj format je zaglavlje od 10 bajta koji sadrži čarobni broj (što znači numeričku ili tekstualnu vrijednost koja se nikada ne mijenja i koristi se za označavanje formata datoteke ili protokola, neimenovane numeričke vrijednosti koja se nikada ne mijenja ili različite vrijednosti koje se ne mogu zamijeniti za bilo što drugo), dodatni zaglavlja koja mogu biti ili možda nisu potrebna (izvorni naziv datoteke, na primjer), tijelo koje sadrži DEFLATE komprimirani sadržaj (što je podatak koji zaglavlja nose) i 8-byte podnožje koji sadrži CRC-32 checksum, kao i stvarnu duljinu izvornih nekomprimiranih podataka.

Postoji niz tehnika kompresije korištene u BZIP2 formatu, koje se slože jedna u drugu u nekoliko slojeva. Oni se pojavljuju u vrlo osebujnom redoslijedu: Šifriranje uzdužne dužine (koja je bilo koji niz od četiri do 255 duplikata simbola zamijenjen s prva četiri simbola i dužina kodiranja koja se ponavlja između 0 i 251), Burrows-Wheeler transformacija (što je reverzibilno blok-sortiranje koje čini samu jezgru BZIP2), premjesti se ispred (ostavlja veličinu obrađenog bloka nepromijenjenim), šifriranje duljine (koja se sastoji od dugih niza simbola - obično nula - ponavljaju se u izlazu i zamjenjuju se simbolom i slijedom dva kodova), Huffmanovom kodiranjem (koji je postupak koji zamjenjuje fiksne duljinske simbole 8-bitnih bajtova s ​​promjenjivim kodovima duljine), Multiple Hoffmanov kodiranje (koji se sastoji od više Hoffmanovih tablica identične veličine), Unary bazno 1 kodiranje, Delta kodiranje i Sparse bitni niz.

Sažetak:

1. GZIP je besplatna aplikacija koja se koristi za komprimiranje datoteka; BZIP2 je algoritam za komprimiranje podataka bez gubitaka otvorenog koda koji omogućuje preuzimanje izvornih podataka komprimirane datoteke.

2. GZIP se sastoji od 10-byte zaglavlja, dodatnih zaglavlja, tijela i 8-byte footer; BZIP2 se sastoji od ne manje od devet slojeva tehnika kompresije.