Як працює стиснення JPEG

Просте пояснення етапів ефективного стиснення зображень

24. January 2025 від Bianca Palmer

Чи замислювалися ви, як телефон або камера можуть зробити знімок, і вже за мить він зберігається як JPEG - менший за розміром, швидший і все ще чіткий? Насправді за лаштунками працює складний процес, який зменшує величезні файли зображень до частки їхнього початкового розміру, зберігаючи високу якість. Але як це взагалі працює? Сьогодні ми заглибимося в усі деталі Стиснення JPEG, розібравши кожен крок простими словами, щоб ви повністю зрозуміли цей, здавалося б, магічний процес стиснення зображень.

Що таке JPEG?

JPEG (скорочення від Joint Photographic Experts Group) є одним із найпоширеніших форматів зображень. стандартним вибором для зберігання цифрових фотографій. Справжня перевага JPEG у його здатності стискати файли зображень, роблячи їх значно меншими без помітної втрати якості.

Для прикладу, високоякісне нестиснене зображення може важити аж 46 МБ. Після стиснення в JPEG те саме зображення може зменшитися до лише 4,1 МБ! Але як йому вдається це зробити, зберігаючи чіткість зображення?

Відповідь криється в compression process, процесі стиснення, який використовує особливості роботи нашого зору та прибирає зайві дані.

Що робить JPEG?

Простими словами, JPEG аналізує зображення та прибирає елементи, які наше око погано помічає. Коли ви стискаєте зображення в JPEG, ви можете керувати ступенем стиснення. Регулюючи параметр "quality" (якість), ви вирішуєте, скільки місця хочете заощадити. Коли якість зменшується зі 100% до 0%, розмір файлу також зменшується.

Коли ви стискаєте сильніше, роздільна здатність зображення залишається тією ж, але можуть з’явитися дефекти або "артефакти". Ці дефекти виглядають як маленькі квадрати, але їх часто важко помітити без наближення. Мета JPEG - зробити файл якомога меншим, не погіршуючи зовнішній вигляд зображення для людського ока.

Кроки стиснення JPEG

Стиснення JPEG Стиснення JPEG - це не один «чарівний трюк», а серія продуманих кроків, спрямованих на зменшення розміру зображення. Розгляньмо п’ять ключових етапів, які роблять JPEG таким ефективним.

Крок 1: Перетворення колірного простору

Зображення складаються з пікселів, і кожен піксель має червону, зелену та синю (RGB) компоненти, які разом створюють колір. JPEG починає з перетворення цих RGB-значень в інший колірний простір:

Яскравість (Luminance): Відповідає за яскравість пікселя та важлива для загального контрасту зображення.
Хромінанс (Chrominance): Містить інформацію про колір, включно з відтінком (hue) та насиченістю (saturation).

Це перетворення використовує той факт, що людське око чутливіше до яскравості (люмінансу), ніж до кольору (хромінансу). Відокремивши яскравість від кольору, JPEG дає змогу цілеспрямовано зменшувати обсяг даних на наступних етапах, зберігаючи при цьому критично важливі візуальні деталі.

На цьому кроці дані ще не втрачаються, але він готує основу для ефективного стиснення.

Крок 2: Зменшення хромінансу / хромасабсемплінг

Хромасабсемплінг є - це метод, який застосовується після перетворення колірного простору. Пам’ятаєте, ми згадували, що наше око гірше розрізняє кольори (хромінанс), ніж яскравість (люмінанс)?

JPEG використовує це, зменшуючи кількість колірних даних. Він стискає синій і червоний хромінанс шляхом усереднення в блоках по чотири пікселі. Це значно зменшує обсяг колірних даних, при цьому яскравість (люмінанс) залишається незмінною. На цьому етапі зображення вже наполовину стиснене!

Крок 3: Перетворення за допомогою дискретного косинусного перетворення (DCT)

Дискретне косинусне перетворення (DCT) - це математичний метод, який перетворює дані зображення з просторової області (де зображення подано як сітка пікселів) у частотну область. Цей процес допомагає визначити, які частини зображення містять найважливішу візуальну інформацію, а які можна відкидається.

DCT розбиває зображення на блоки 8x8 та перетворює кожен блок у набір частотних значень. Вищі частоти, які відповідають швидким змінам значень пікселів, як-от краї або шум, часто менш помітні для людського ока й можуть бути спрощені або видалені.

Крок 4: Квантування

Після застосування DCT отримані частотні дані проходять квантування. На цьому етапі діапазон частотних значень зменшується шляхом ділення їх на набір констант, що називається таблицею квантування. Такий процес по суті заокруглює частотні значення, спрощуючи їх.

Більш високі частоти квантуються сильніше, тобто втрачають більше точності, оскільки вони менш важливі для загальної якості зображення. Цей четвертий крок зменшує обсяг даних, необхідних для представлення зображення, роблячи файл меншим. Однак надто сильне квантування може призвести до помітних артефактів, як-от блокуватість або розмиття, особливо за високих рівнів стиснення.

Крок 5: Кодування довжин серій та Хафмана

Після квантування дані все ще недостатньо компактні для ефективного зберігання. Тут у справу вступають Run Length Encoding (RLE) та Huffman Encoding які

Спочатку RLE використовується для спрощення довгих послідовностей повторюваних даних (наприклад, нулів) шляхом збереження кількості повторень замість кожного окремого значення. Потім застосовується кодування Хафмана, техніка, що замінює часто вживані значення коротшими бітовими кодами, роблячи файл ще меншим.

These two методи кодування працюють разом, щоб суттєво зменшити розмір файлу, не жертвуючи значною частиною якості зображення!

Додаткові примітки

Хоча JPEG є надзвичайно ефективним форматом, варто врахувати кілька важливих моментів:

Рівень стиснення: JPEG дозволяє користувачам обирати рівень стиснення, але вищий рівень стиснення зменшує розмір файлу й може призвести до появи помітних артефактів, як-от розмиті краї або пікселізація. Це результат надто великих значень у таблиці квантування, що призводить до більшої кількості нулів у даних: файл стає меншим, але за рахунок якості зображення.
Втрата високочастотних даних: квантування зменшує точність високочастотних даних (деталі на кшталт різких країв), тому JPEG добре підходить для плавних текстур, але може погано справлятися з різкими лініями та векторною графікою.
Неідеальний для векторної графіки: JPEG не є найкращим вибором для стиснення векторної графіки, оскільки може спричиняти помітні артефакти на межах фігур або ліній.

Попри ці обмеження, JPEG залишається найпопулярнішим форматом зображень, частково тому, що він старий, добре вивчений і вільний від роялті. Однак нові формати, як-от WebP або HEIF забезпечують ще кращі коефіцієнти стиснення без погіршення якості, що робить їх привабливими альтернативами в певних сценаріях.

Підсумок

Алгоритм стиснення JPEG є помітним досягненням в управлінні даними зображень. Розбиваючи зображення на менші блоки, застосовуючи різні математичні перетворення та використовуючи ефективні методи кодування, такі як Run Length і кодування Хафмана, він дозволяє зберігати зображення високої якості у значно менших файлах.

Хоча JPEG має певні обмеження, особливо за високих рівнів стиснення або для векторної графіки, його широка підтримка та здатність забезпечувати хороші результати для фотографічних зображень роблять його сталим стандартом.