plaatje

Datacompressie

compressie bij afbeedingen en video:

Een pixel is het kleinste deel van een afbeelding. Elke pixel heeft 1 kleur, en samen vormen al die pixels een afbeelding. Omdat afbeeldingen uit heel veel pixels bestaan, nemen ze veel opslagruimte in. Daarom gebruiken we compressie om bestanden kleiner te maken. Compressie betekent dat je een bestand verkleint zonder dat het onbruikbaar wordt. Er zijn twee soorten: lossy en lossless. Bij lossy compressie wordt een deel van de informatie verwijderd of aangepast, zodat het bestand kleiner wordt. Er gaat dus wat kwaliteit verloren, maar dat zie je meestal nauwelijks. Een voorbeeld is JPEG (JPG), dat veel gebruikt wordt bij foto's. Daarbij worden kleuren die bijna hetzelfde zijn samengevoegd, zodat er minder data nodig is. Foto's op je smartphone worden automatisch met lossy compressie opgeslagen. Bij lossless compressie blijft alle informatie behouden. De gegevens worden slimmer opgeslagen, zonder dat er iets verdwijnt. Een voorbeeld is RLE (Run Length Encoding), waarbij herhalingen worden ingekort. Bijvoorbeeld: vier dezelfde pixels 36, 36, 36, 36 worden opgeslagen als (4,36). Je kunt een lossless bestand altijd weer precies herstellen naar het origineel.

compressie bij geluidsfragmenten:

MP3 is een bekende manier om muziek te comprimeren. Het is een lossy methode, wat betekent dat er informatie verloren gaat, maar dit hoor je meestal niet. Het menselijk oor kan geluiden horen tot ongeveer 20 kHz, maar bij MP3 worden tonen boven 16 kHz vaak weggelaten als er veel ander geluid is. De kwaliteit van muziek hangt af van de sample rate (hoe vaak per seconde geluid wordt gemeten) en het aantal bits waarmee dit wordt opgeslagen. Samen vormen ze de bitrate, uitgedrukt in kilobits per seconde (kbps). Een gewone opname heeft een sample rate van 44.100 Hz en 32 bits, wat een bitrate van 1.411 kbps geeft. Soms worden hogere sample rates gebruikt, zoals 192.000 Hz, maar dat hoor je bijna niet. Bij een bitrate van 256 kbps klinkt muziek bijna hetzelfde als het origineel. Bij 128 kbps kun je soms vervorming horen. Een MP3 van 128 kbps is ongeveer 11 keer kleiner dan het origineel: 1 minuut muziek kost dan ongeveer 1 MB opslagruimte. Een uur muziek streamen gebruikt ongeveer 60 MB data.

Bytes, kB, MB en meer:

In het SI-stelsel zijn zeven basiseenheden, zoals meter en kelvin. Er zijn voorvoegsels om grote en kleine eenheden aan te geven, zoals milli- (0,001), centi- (0,01), kilo- (1.000) en mega-(1.000.000). In de informatica is de byte de basiseenheid, gelijk aan 8 bits. Computers gebruikten vroeger 1.024 in plaats van 1.000, omdat dat makkelijker was. Daardoor was 1 kilobyte eigenlijk 1.024 bytes. Bij grote opslagmaten kan dat verschil oplopen tot 10%. Daarom zijn binaire voorvoegsels bedacht: KiB (1.024 bytes), MiB (1.048.576 bytes), GiB (1.073.741.824 bytes) en TiB (1.099.511.627.776 bytes). Veel bedrijven gebruiken nog de gewone SI-voorvoegsels, maar het is belangrijk om duidelijk te zijn wat je bedoelt.

Bestandsformaten en JPEG-compressie:

Digitale bestanden zoals tekst, afbeeldingen en geluid worden opgeslagen in bytes, en hun formaat bepaalt de betekenis. Besturingssystemen herkennen formaten via extensies (bijv. .docx, .txt) of door de eerste bytes te lezen. Bestanden hebben ook een MIME-type, officieel vastgelegd door IANA. Bij JPEG-afbeeldingen wordt een pixel opgesplitst in helderheid en kleurverschillen (blauw- en roodverschil). Het oog is gevoeliger voor helderheid, dus bij compressie wordt de kleur sterker verkleind dan de helderheid. Zo blijven JPEG-bestanden klein, terwijl ze er nog goed uitzien.