有损压缩与无损压缩的工作原理

图像压缩的本质是平衡存储空间视觉质量。本页面将深度解析如何利用数学冗余视觉感知极限来实现数据的极致精简。

1. 熵编码与统计冗余

无损压缩

香农熵 (Shannon Entropy) 定义了数据的压缩极限。点击色块改变排列:

当前数据熵: 0.000 bits/px
数据流: 16W

2. 感知冗余与色彩转换

有损压缩

人眼对亮度 (Y) 敏感,但对色度 (Cb/Cr) 迟钝。

Y = 0.299R + 0.587G + 0.114B

3. 频域变换与量化失真

核心算法

离散余弦变换 (DCT) 将图像转为频率,随后通过量化步长丢弃信息。

高保真
量化强度 (Q-Step) Level: 20
PSNR (峰值信噪比): 40.00 dB

率失真理论 (Rate-Distortion Theory)

权衡:多小的体积下能保留多少细节?

R-D 曲线:算法的性能边界

所有有损算法都遵循一个规律:比特率 (Rate) 越低,失真 (Distortion) 越高。优秀的编码器(如 AV1)能在极低码率下保持极高相似度。

低码率 (Blocky) 高码率 (Sharp)

什么是“透明压缩”?

当压缩图像的 PSNR 达到 35-45dB 左右时,人类视觉系统 (HVS) 几乎无法分辨其与原图的区别。这种“欺骗”眼睛的艺术是有损压缩的核心。

SSIM (结构相似性) 指标

相比传统的 PSNRSSIM 衡量的是图像的结构、亮度和对比度。它比单纯计算像素误差更符合人类的主观审美。

为什么不能无限压缩?

无损压缩受限于数据的信息熵。如果数据是完全随机的噪声,其熵达到最大值,没有任何算法能减小其体积。有损压缩虽然可以继续丢弃数据,但一旦量化步长过大,图像将塌陷为单色色块。

帧内预测 (Intra-prediction)

现代格式如 WebPHEIF 引入了视频编码中的帧内预测。它们尝试用周围已有的像素块来推测当前块的内容,只记录“预测失败”的部分(残差),这比 JPEG 的全块记录效率更高。