有損壓縮與無損壓縮的工作原理

圖像壓縮的本質是平衡存儲空間視覺質量。本頁面將深度解析如何利用數學冗餘視覺感知極限來實現數據的極致精簡。

1. 熵編碼與統計冗餘

無損壓縮

香農熵 (Shannon Entropy) 定義了數據的壓縮極限。點擊色塊改變排列:

當前數據熵: 0.000 bits/px
數據流: 16W

2. 感知冗餘與色彩轉換

有損壓縮

人眼對亮度 (Y) 敏感,但對色度 (Cb/Cr) 遲鈍。

Y = 0.299R + 0.587G + 0.114B

3. 頻域變換與量化失真

核心演算法

離散餘弦變換 (DCT) 將圖像轉為頻率,隨後通過量化步長丟棄信息。

高保真
量化強度 (Q-Step) Level: 20
PSNR (峰值信噪比): 40.00 dB

率失真理論 (Rate-Distortion Theory)

權衡:多小的體積下能保留多少細節?

R-D 曲線:演算法的性能邊界

所有有損演算法都遵循一個規律:比特率 (Rate) 越低,失真 (Distortion) 越高。優秀的編碼器(如 AV1)能在極低碼率下保持極高相似度。

低碼率 (Blocky) 高碼率 (Sharp)

什麼是“透明壓縮”?

當壓縮圖像的 PSNR 達到 35-45dB 左右時,人類視覺系統 (HVS) 幾乎無法分辨其與原圖的區別。這種“欺騙”眼睛的藝術是有損壓縮的核心。

SSIM (結構相似性) 指標

相比傳統的 PSNRSSIM 衡量的是圖像的結構、亮度和對比度。它比單純計算像素誤差更符合人類的主觀審美。

為什麼不能無限壓縮?

無損壓縮受限於數據的信息熵。如果數據是完全隨機的噪聲,其熵達到最大值,沒有任何演算法能減小其體積。有損壓縮雖然可以繼續丟棄數據,但一旦量化步長過大,圖像將塌陷為單色色塊。

幀內預測 (Intra-prediction)

現代格式如 WebPHEIF 引入了視頻編碼中的幀內預測。它們嘗試用周圍已有的像素塊來推測當前塊的內容,只記錄“預測失敗”的部分(殘差),這比 JPEG 的全塊記錄效率更高。