圖像壓縮的本質是平衡存儲空間與視覺質量。本頁面將深度解析如何利用數學冗餘與視覺感知極限來實現數據的極致精簡。
香農熵 (Shannon Entropy) 定義了數據的壓縮極限。點擊色塊改變排列:
人眼對亮度 (Y) 敏感,但對色度 (Cb/Cr) 遲鈍。
離散餘弦變換 (DCT) 將圖像轉為頻率,隨後通過量化步長丟棄信息。
權衡:多小的體積下能保留多少細節?
所有有損演算法都遵循一個規律:比特率 (Rate) 越低,失真 (Distortion) 越高。優秀的編碼器(如 AV1)能在極低碼率下保持極高相似度。
當壓縮圖像的 PSNR 達到 35-45dB 左右時,人類視覺系統 (HVS) 幾乎無法分辨其與原圖的區別。這種“欺騙”眼睛的藝術是有損壓縮的核心。
相比傳統的 PSNR,SSIM 衡量的是圖像的結構、亮度和對比度。它比單純計算像素誤差更符合人類的主觀審美。
無損壓縮受限於數據的信息熵。如果數據是完全隨機的噪聲,其熵達到最大值,沒有任何演算法能減小其體積。有損壓縮雖然可以繼續丟棄數據,但一旦量化步長過大,圖像將塌陷為單色色塊。
現代格式如 WebP 和 HEIF 引入了視頻編碼中的幀內預測。它們嘗試用周圍已有的像素塊來推測當前塊的內容,只記錄“預測失敗”的部分(殘差),這比 JPEG 的全塊記錄效率更高。