非可逆圧縮と可逆圧縮の仕組み

画像圧縮の本質は、保存容量と画質のバランスです。このページでは、数学的冗長性と視覚的知覚の限界を利用してデータを極限まで削減する方法を解説します。

可逆圧縮

シャノンエントロピーはデータ圧縮の限界を定義します。ブロックをクリックしてパターンを変更：

現在のエントロピー: 0.000 bits/px

ストリーム: 16W

非可逆圧縮

人間の目は輝度 (Y)には敏感ですが、色差 (Cb/Cr)には鈍感です。

Y = 0.299R + 0.587G + 0.114B

コアアルゴリズム

離散コサイン変換 (DCT)で画像を周波数に変換し、量子化ステップで情報を間引きます。

高忠実度

量子化強度 (Q-Step) Level: 20

PSNR (ピーク信号対雑音比): 40.00 dB

レート歪み理論 (Rate-Distortion Theory)

トレードオフ：どれだけの詳細をどのサイズで保持できるか？

すべての非可逆アルゴリズムは法則に従います：ビットレート (Rate)が低いほど、歪み (Distortion)は高くなります。優れたエンコーダー（AV1など）は、極低ビットレートでも高い類似性を維持します。

低レート (ブロック状) 高レート (鮮明)

圧縮画像のPSNRが35-45dB程度に達すると、人間の視覚システム (HVS) は元の画像とほとんど区別できなくなります。この目を「欺く」技術が非可逆圧縮の核心です。

従来のPSNRと比較して、SSIMは画像の構造、輝度、コントラストを測定します。単純なピクセル誤差計算よりも人間の主観的な美学に合致しています。

可逆圧縮はデータの情報エントロピーに制限されます。データが完全にランダムなノイズであれば、エントロピーは最大になり、どんなアルゴリズムでもサイズを減らせません。非可逆圧縮はデータを捨て続けられますが、量子化ステップが大きすぎると、画像は単色のブロックに崩壊します。

WebPやHEIFなどの最新フォーマットは、動画圧縮の画面内予測を導入しています。周囲のピクセルから現在のブロックの内容を推測し、「予測に失敗した」部分（残差）のみを記録します。これはJPEGの全ブロック記録よりも効率的です。