画像圧縮の本質は、保存容量と画質のバランスです。このページでは、数学的冗長性と視覚的知覚の限界を利用してデータを極限まで削減する方法を解説します。
シャノンエントロピーはデータ圧縮の限界を定義します。ブロックをクリックしてパターンを変更:
人間の目は輝度 (Y)には敏感ですが、色差 (Cb/Cr)には鈍感です。
離散コサイン変換 (DCT)で画像を周波数に変換し、量子化ステップで情報を間引きます。
トレードオフ:どれだけの詳細をどのサイズで保持できるか?
すべての非可逆アルゴリズムは法則に従います:ビットレート (Rate)が低いほど、歪み (Distortion)は高くなります。優れたエンコーダー(AV1など)は、極低ビットレートでも高い類似性を維持します。
圧縮画像のPSNRが35-45dB程度に達すると、人間の視覚システム (HVS) は元の画像とほとんど区別できなくなります。この目を「欺く」技術が非可逆圧縮の核心です。
従来のPSNRと比較して、SSIMは画像の構造、輝度、コントラストを測定します。単純なピクセル誤差計算よりも人間の主観的な美学に合致しています。
可逆圧縮はデータの情報エントロピーに制限されます。データが完全にランダムなノイズであれば、エントロピーは最大になり、どんなアルゴリズムでもサイズを減らせません。非可逆圧縮はデータを捨て続けられますが、量子化ステップが大きすぎると、画像は単色のブロックに崩壊します。
WebPやHEIFなどの最新フォーマットは、動画圧縮の画面内予測を導入しています。周囲のピクセルから現在のブロックの内容を推測し、「予測に失敗した」部分(残差)のみを記録します。これはJPEGの全ブロック記録よりも効率的です。