非可逆圧縮と可逆圧縮の仕組み

画像圧縮の本質は、保存容量画質のバランスです。このページでは、数学的冗長性視覚的知覚の限界を利用してデータを極限まで削減する方法を解説します。

1. エントロピー符号化と統計的冗長性

可逆圧縮

シャノンエントロピーはデータ圧縮の限界を定義します。ブロックをクリックしてパターンを変更:

現在のエントロピー: 0.000 bits/px
ストリーム: 16W

2. 知覚的冗長性と色空間変換

非可逆圧縮

人間の目は輝度 (Y)には敏感ですが、色差 (Cb/Cr)には鈍感です。

Y = 0.299R + 0.587G + 0.114B

3. 周波数変換と量子化

コアアルゴリズム

離散コサイン変換 (DCT)で画像を周波数に変換し、量子化ステップで情報を間引きます。

高忠実度
量子化強度 (Q-Step) Level: 20
PSNR (ピーク信号対雑音比): 40.00 dB

レート歪み理論 (Rate-Distortion Theory)

トレードオフ:どれだけの詳細をどのサイズで保持できるか?

R-D曲線:アルゴリズムの性能限界

すべての非可逆アルゴリズムは法則に従います:ビットレート (Rate)が低いほど、歪み (Distortion)は高くなります。優れたエンコーダー(AV1など)は、極低ビットレートでも高い類似性を維持します。

低レート (ブロック状) 高レート (鮮明)

「透過的圧縮」とは?

圧縮画像のPSNRが35-45dB程度に達すると、人間の視覚システム (HVS) は元の画像とほとんど区別できなくなります。この目を「欺く」技術が非可逆圧縮の核心です。

SSIM (構造的類似性) 指標

従来のPSNRと比較して、SSIMは画像の構造、輝度、コントラストを測定します。単純なピクセル誤差計算よりも人間の主観的な美学に合致しています。

なぜ無限に圧縮できないのか?

可逆圧縮はデータの情報エントロピーに制限されます。データが完全にランダムなノイズであれば、エントロピーは最大になり、どんなアルゴリズムでもサイズを減らせません。非可逆圧縮はデータを捨て続けられますが、量子化ステップが大きすぎると、画像は単色のブロックに崩壊します。

画面内予測 (Intra-prediction)

WebPHEIFなどの最新フォーマットは、動画圧縮の画面内予測を導入しています。周囲のピクセルから現在のブロックの内容を推測し、「予測に失敗した」部分(残差)のみを記録します。これはJPEGの全ブロック記録よりも効率的です。