图像压缩的本质是平衡存储空间与视觉质量。本页面将深度解析如何利用数学冗余与视觉感知极限来实现数据的极致精简。
香农熵 (Shannon Entropy) 定义了数据的压缩极限。点击色块改变排列:
人眼对亮度 (Y) 敏感,但对色度 (Cb/Cr) 迟钝。
离散余弦变换 (DCT) 将图像转为频率,随后通过量化步长丢弃信息。
权衡:多小的体积下能保留多少细节?
所有有损算法都遵循一个规律:比特率 (Rate) 越低,失真 (Distortion) 越高。优秀的编码器(如 AV1)能在极低码率下保持极高相似度。
当压缩图像的 PSNR 达到 35-45dB 左右时,人类视觉系统 (HVS) 几乎无法分辨其与原图的区别。这种“欺骗”眼睛的艺术是有损压缩的核心。
相比传统的 PSNR,SSIM 衡量的是图像的结构、亮度和对比度。它比单纯计算像素误差更符合人类的主观审美。
无损压缩受限于数据的信息熵。如果数据是完全随机的噪声,其熵达到最大值,没有任何算法能减小其体积。有损压缩虽然可以继续丢弃数据,但一旦量化步长过大,图像将塌陷为单色色块。
现代格式如 WebP 和 HEIF 引入了视频编码中的帧内预测。它们尝试用周围已有的像素块来推测当前块的内容,只记录“预测失败”的部分(残差),这比 JPEG 的全块记录效率更高。