adattömörítés

Miért kell tömöríteni az információkat és mi a módja kell csinálni.

És tényleg, miért? Mi számítani, például, mennyi memóriát vesz egy kép minősége közel a TV-t. Legyen az ő engedélyével - .. 800h6009 pixel, és a szám árnyalatú mintegy 16 ezer (High Color), azaz minden pixel színét képviseli a két byte-kódot. 800x600 = 480000 elemek. 480000x2 bájt = 960000 byte - egy kicsit kevesebb, mint 1 megabájt. Úgy tűnik, nem annyira - a lézerlemezjátszóhoz hogy nagyobb 650 kép. Nos, ha beszélünk a film? A szabványos filmvetítéssel sebességgel - 24 képkocka másodpercenként. Tehát a CD felírható fragment hossz 650: 24 = 27 másodperc. Amennyiben ez megfelel. De nem ez az egyetlen eset, amikor az információ „túl sok”. Így az egyik oka az adatok felhasználása tömörítés - a vágy, hogy több információt a memóriába az azonos kapacitású. Van egy másik ok. adattömörítési gyorsítja annak átviteli. De ez - a következő fejezetben.

Számos módszer a tömörítés (kompressii10) adatokat. Mindegyikük lehet két csoportra oszthatók - veszteségmentes és veszteséges. Az első esetben, a kitömörítés üzenet szorosan követi az eredetit. Persze, így képes feldolgozni bármilyen információt. A tömörítés a veszteségek csak akkor lehetséges, azokban az esetekben, ahol az elfogadhatóság bizonyos torzulások - amely függ az adott típusú adatot.

Szinte minden veszteségmentes tömörítést módszerek alapján a két igen egyszerű ötleteket.

Egyikük meg először a módszer a tömörítés szövegének adatokat, a javasolt 1952 Huffman. Tudja, hogy a szokásos, minden karakter a szöveg van kódolva egy bájt. De az a tény, hogy egyes betűk gyakrabban, mások kevésbé. Például, egy szöveges orosz nyelvű, minden ezer karakter átlagosan 90 betűt „a”, 72 - „e”, és csak 2 - „f”. Legfőképpen, majd a réseket: 174. Ha a leggyakoribb használt szimbólumok rövidebb kódok (alsó 8 bit), és a kevésbé gyakori - hosszú (több mint 8 bit), a szöveg egészének akkor kevesebb memóriát igényel, mint a szabványos kódolási.

Számos tömörítési módszerek alapján a számla ismételt bájt vagy bájtsorozatba. A legegyszerűbb közülük - RLE11 - széles körben használják a képre tömörítés. A tömörített fájlok ilyen módon rögzíti, hányszor ismételte ugyanazt bájt. Például ahelyett, hogy az „RRRRRGGGBBBBBBRRRBBRRRRRRR” kell tárolni „5R3G6B3R2B7R” 12. Nyilvánvaló, hogy ez a módszer akkor működik a legjobban, ha a kép tartalmaz nagy területeken egy színárnyékolt.

További eljárások azon a tényen alapul, hogy ha egy bájtsorozatok találtak egy fájlt többször meg lehet írni egyszer egy külön táblázatban, majd egyszerűen jelzi, „hogy ennyi bájt ilyen tábla helyet.” 13

Veszteségmentes tömörítési eljárások csökkentik fájl mérete nem túl erős. Jellemzően, a tömörítési arány nem haladja meg az 1 / 3-1 / 4. Sokkal jobb eredményeket lehet elérni, amely a veszteséges tömörítés. Ebben az esetben alapján speciális vizsgálatokat meghatározni, hogy milyen információkat lehet feláldozni.

Jegyezzük meg, hogy ne próbálja tömöríteni a fájlokat tömörítve: a méret bármilyen csökkenése csak kis mértékben, vagy akár nő.

Tény, hogy a televíziós kép 625 sor.

Compressus (Lat.) - meghúzási.

Run-Length Encoding (Eng.) - hosszúságú kódoló szekvenciát.

Valójában persze használ színkódok és azt jelölik, akár hányszor ismételjük a következő bájt, vagy hány byte a következő - nem ismétlődő.

Ez a gondolat alapja széles körben használják a különböző tömörítési LZW eljárással, így nevezték az első betű a nevét a fejlődés: Lempel, Ziv és Welch.

Joint Photographic Experts Group (Eng.) - Joint Photographic Experts Group, amely kidolgozta a névadó kép tömörítési módszer.

Moving Picture Experts Group (Eng.) - Expert Group Moving Pictures