Jak działa kompresja JPEG

Prosty podział kroków stojących za wydajną kompresją obrazu

24. January 2025 autor Bianca Palmer

Czy kiedykolwiek zastanawiałeś się, jak Twój telefon lub aparat może zrobić zdjęcie, a po chwili jest ono zapisane jako JPEG - mniejsze, szybsze i nadal ostre? Za kulisami działa zaawansowany proces, który zmniejsza ogromne pliki graficzne do ułamka ich pierwotnego rozmiaru, zachowując bardzo dobrą jakość. Ale jak to właściwie działa? Dziś zagłębimy się w szczegóły Kompresja JPEG, rozbijając każdy krok na proste elementy, abyś mógł w pełni zrozumieć ten „magiczny” proces kompresji obrazów.

Co to jest JPEG?

JPEG (skrót od Joint Photographic Experts Group) jest jednym z najpopularniejszych formatów obrazów. To podstawowy wybór do przechowywania zdjęć cyfrowych. Prawdziwą zaletą JPEG jest możliwość kompresowania plików graficznych, co sprawia, że są znacznie mniejsze bez zauważalnej utraty jakości.

Dla porównania: wysokiej jakości nieskompresowany obraz może zajmować 46 MB. Po skompresowaniu do JPEG ten sam obraz może zmniejszyć się do zaledwie 4,1 MB! Jak udaje się to osiągnąć przy zachowaniu ostrości obrazu?

Odpowiedź tkwi w compression process, procesie kompresji, który wykorzystuje sposób, w jaki działa nasz wzrok, i usuwa zbędne dane.

Co robi JPEG?

W uproszczeniu JPEG analizuje obraz i usuwa elementy, których ludzkie oko i tak łatwo nie dostrzeże. Gdy kompresujesz obraz w formacie JPEG, możesz kontrolować, jak silna będzie kompresja. Regulując ustawienie „jakości” decydujesz, ile miejsca chcesz zaoszczędzić. Gdy jakość spada ze 100% do 0%, rozmiar pliku również się zmniejsza.

Im mocniej kompresujesz, tym rozdzielczość obrazu pozostaje taka sama, ale mogą zacząć pojawiać się defekty lub „artefakty”, wyglądające jak małe kwadraty. Często są trudne do zauważenia, dopóki nie powiększysz obrazu. Celem JPEG jest zmniejszenie pliku tak bardzo, jak to możliwe, bez pogorszenia wyglądu obrazu dla ludzkiego oka.

Etapy kompresji JPEG

Kompresja JPEG Kompresja JPEG to nie jeden trik, ale seria sprytnych kroków zaprojektowanych tak, aby zmniejszyć rozmiar obrazu. Przyjrzyjmy się pięciu kluczowym etapom, które sprawiają, że JPEG jest tak wydajny.

Krok 1: Konwersja przestrzeni barw

Obrazy składają się z pikseli, a każdy piksel ma składowe czerwieni, zieleni i niebieskiego (RGB), które łączą się, tworząc kolory. JPEG zaczyna od konwersji tych wartości RGB na inną przestrzeń barw:

Luminancja (jasność): Reprezentuje jasność lub „światłość” piksela i jest kluczowa dla ogólnego kontrastu obrazu.
Chrominancja (kolor): Reprezentuje informacje o kolorze, w tym zarówno odcień, jak i nasycenie.

Ta konwersja wykorzystuje fakt, że ludzkie oko jest bardziej wrażliwe na jasność (luminancję) niż na kolor (chrominancję). Oddzielając jasność od koloru, JPEG umożliwia ukierunkowaną redukcję danych w kolejnych krokach, zachowując przy tym kluczowe szczegóły wizualne.

W tym etapie nie są tracone żadne dane, ale przygotowuje on grunt pod efektywną kompresję.

Krok 2: Zmniejszanie chrominancji / Chroma Subsampling

Chroma Subsampling jest to technika stosowana po konwersji przestrzeni barw. Pamiętasz, jak wspomnieliśmy, że nasz wzrok gorzej rozróżnia kolory (chrominancję) niż jasność (luminancję)?

JPEG wykorzystuje ten fakt, zmniejszając ilość danych o kolorze. Pomniejsza obrazy chrominancji niebieskiej i czerwonej, uśredniając je w blokach po cztery piksele. Dzięki temu dane o kolorze są znacznie mniejsze, przy zachowaniu luminancji (jasności) bez zmian. Na tym etapie obraz jest już w połowie skompresowany!

Krok 3: Dyskretna transformata cosinusowa (DCT)

Dyskretna transformata cosinusowa (DCT) to technika matematyczna używana do przekształcenia danych obrazu z dziedziny przestrzennej (gdzie obraz jest siatką pikseli) do dziedziny częstotliwości. Ten proces pomaga określić, które części obrazu zawierają najważniejsze informacje wizualne, a które można odrzucone.

DCT dzieli obraz na bloki 8x8 i przekształca każdy blok w zbiór wartości częstotliwości. Wyższe częstotliwości, które reprezentują szybkie zmiany wartości pikseli, takie jak krawędzie lub szum, są często mniej zauważalne dla ludzkiego oka i mogą zostać uproszczone lub usunięte.

Krok 4: Kwantyzacja

Po zastosowaniu DCT uzyskane dane częstotliwości podlegają kwantyzacji. W tym kroku zakres wartości częstotliwości jest zmniejszany przez podzielenie ich przez zestaw stałych zwanych tablicą kwantyzacji. Ten proces w praktyce zaokrągla wartości częstotliwości, aby je uprościć.

Wyższe częstotliwości są kwantyzowane mocniej, co oznacza, że tracą więcej precyzji, ponieważ są mniej istotne dla ogólnej jakości obrazu. Ten czwarty krok zmniejsza ilość danych potrzebnych do reprezentacji obrazu, dzięki czemu plik jest mniejszy. Jednak zbyt silna kwantyzacja może prowadzić do widocznych artefaktów, takich jak blokowość lub rozmycie, szczególnie przy wyższych poziomach kompresji.

Krok 5: Kodowanie RLE i Huffmana

Po kwantyzacji dane wciąż nie są wystarczająco zwarte do efektywnego przechowywania. W tym momencie do gry wchodzą Run Length Encoding (RLE) i Kodowanie Huffmana i inne techniki.

Najpierw RLE upraszcza długie sekwencje powtarzających się danych (np. zer), zapisując liczbę powtórzeń zamiast każdej pojedynczej wartości. Następnie stosowane jest kodowanie Huffmana, technika, która zastępuje często występujące wartości krótszymi kodami bitowymi, co jeszcze bardziej zmniejsza rozmiar pliku.

These two metody kodowania współpracują ze sobą, aby drastycznie zmniejszyć rozmiar pliku bez poświęcania zbyt dużej części jakości obrazu!

Dodatkowe informacje

Chociaż JPEG jest bardzo wydajnym formatem, warto pamiętać o kilku kwestiach:

Poziom kompresji: JPEG pozwala użytkownikom wybrać poziom kompresji, ale wyższa kompresja zmniejsza rozmiar pliku i może wprowadzać widoczne artefakty, takie jak rozmyte krawędzie lub pikselizacja. Wynika to z zbyt wysokich wartości w tablicy kwantyzacji, co prowadzi do pojawienia się większej liczby zer, zmniejszając rozmiar pliku kosztem jakości obrazu.
Utrata danych o wysokiej częstotliwości: Kwantyzacja zmniejsza precyzję danych o wysokiej częstotliwości (detali, takich jak ostre krawędzie), dlatego JPEG dobrze sprawdza się przy gładkich teksturach, ale może mieć problemy z ostrymi liniami i grafiką wektorową.
Niezbyt dobry dla grafiki wektorowej: JPEG nie jest najlepszym wyborem do kompresji grafiki wektorowej, ponieważ może powodować widoczne artefakty na granicach kształtów lub linii.

Mimo tych ograniczeń JPEG wciąż pozostaje najpopularniejszym formatem obrazu, częściowo dlatego, że jest stary, dobrze zrozumiany i wolny od opłat licencyjnych. Jednak nowsze formaty, takie jak WebP lub HEIF oferują jeszcze lepsze współczynniki kompresji bez pogorszenia jakości, co czyni je atrakcyjną alternatywą w niektórych zastosowaniach.

Podsumowanie

Algorytm kompresji JPEG jest imponującym osiągnięciem w zarządzaniu danymi obrazu. Dzięki podziałowi obrazu na mniejsze bloki, zastosowaniu różnych przekształceń matematycznych oraz wydajnych technik kodowania, takich jak Run Length i kodowanie Huffmana, pozwala przechowywać obrazy wysokiej jakości w znacznie mniejszych plikach.

Choć JPEG ma pewne ograniczenia, szczególnie przy wysokich poziomach kompresji lub w przypadku grafiki wektorowej, jego powszechne zastosowanie i możliwość uzyskania dobrych efektów dla zdjęć sprawiają, że pozostaje on trwałym standardem.