이미지 압축의 본질은 저장 공간과 시각적 품질의 균형입니다. 이 페이지에서는 수학적 중복성과 시각적 인지 한계를 활용하여 데이터를 극도로 줄이는 방법을 심층 분석합니다.
섀넌 엔트로피(Shannon Entropy)는 데이터 압축의 한계를 정의합니다. 블록을 클릭하여 패턴 변경:
사람의 눈은 밝기(Y)에는 민감하지만 색상(Cb/Cr)에는 둔감합니다.
이산 코사인 변환(DCT)은 이미지를 주파수로 변환한 다음 양자화 단계를 통해 정보를 버립니다.
트레이드오프: 어떤 크기에서 얼마나 많은 세부 정보를 유지할 수 있는가?
모든 손실 알고리즘은 법칙을 따릅니다: 비트레이트(Rate)가 낮을수록 왜곡(Distortion)이 높아집니다. 우수한 인코더(예: AV1)는 매우 낮은 비트레이트에서도 높은 유사성을 유지합니다.
압축된 이미지의 PSNR이 약 35-45dB에 도달하면 인간 시각 시스템(HVS)은 원본과 거의 구별할 수 없습니다. 눈을 "속이는" 이 기술은 손실 압축의 핵심입니다.
전통적인 PSNR과 달리 SSIM은 이미지의 구조, 휘도 및 대비를 측정합니다. 단순한 픽셀 오차 계산보다 인간의 주관적 미학에 더 잘 부합합니다.
무손실 압축은 데이터의 정보 엔트로피에 의해 제한됩니다. 데이터가 완전히 무작위적인 노이즈라면 엔트로피가 최대가 되어 어떤 알고리즘으로도 크기를 줄일 수 없습니다. 손실 압축은 데이터를 계속 버릴 수 있지만, 양자화 단계가 너무 커지면 이미지는 단색 블록으로 무너집니다.
WebP 및 HEIF와 같은 현대 형식은 비디오 코딩의 화면 내 예측을 도입했습니다. 주변 픽셀을 사용하여 현재 블록의 내용을 추측하고 "예측 실패" 부분(잔차)만 기록하므로 JPEG의 전체 블록 기록보다 효율적입니다.