PDF, DJVU 및 이미지에 대한 최고 압축률 압축기는 무엇입니까

PDF, DJVU 및 이미지에 대한 최고 압축률 압축기는 무엇입니까

지금까지 댓글에서는 압축해야 하는 파일 형식을 지정하지 않았으며 명확한 답변도 제시하지 못했습니다.

PDF, djvu로 가득 찬 1TB 하드 드라이브가 있고 나머지는 가능한 가장 작은 크기로 압축해야 하는 이미지이며 속도에는 신경 쓰지 않습니다.

kgb를 시도했지만 CPU를 완전히 활용하지 못했습니다.

나는 tar.lzr, tar.lzma 및 tar.7z를 시도했습니다. tar.lzr이 최고이지만 기대했던 것만큼 많은 기능을 제공하지는 않습니다.

나도 nanozip에 대해 알고 있지만, 내가 본 벤치마크 중 가장 높은 비율을 가지고 있음에도 불구하고 많은 사람들이 이에 대한 문제를 보고하는 것을 보았습니다. 이전에 이에 대한 경험이 있는 사람이 있습니까?

답변1

7z와 lzma는 동일한 압축 알고리즘이지만 컨테이너가 다릅니다. 7z안정적인 보관 모드를 활성화하면 동일한 작업을 수행할 수 tar.7z있으며 개별 파일에 대한 임의 액세스를 제공하는 것도 나쁘지 않습니다. (그래도 여전히 짜증나지만.)

pdf는 내부적으로 gzip을 사용하므로 압축률이 낮습니다. 대부분의 이미지 형식은 동일합니다(엔트로피 인코더의 선택은 다양하지만 IIRC JPEG의 엔트로피 인코더는 더 간단합니다).

이론적으로는 이 아이디어의 구현에 대해 알지 못합니다. 간단한 gzip이나 pdf, png, jpeg 및 기타 다양한 압축 파일 형식의 기타 엔트로피 인코딩을 실행 취소하는 아카이버를 가질 수 있습니다. 그런 다음 LZMA와 같은 좋은 것으로 해당 스트림을 압축하십시오. 추출 시 LZMA 스트림에서 데이터를 추출하고 필요한 부분에 대해 내부적으로 PDF를 다시 압축할 수 있습니다. 출력은 pdf/jpg/무엇이든 동일하지만 파일의 체크섬/해시가 다를 수 있습니다. (따라서 최종 렌더링된 픽셀 측면에서는 무손실이지만 파일 바이트 측면에서는 손실이 없습니다.)

PNG 및 jpeg 최적화 프로그램은 개별 파일에 대해 이 아이디어를 어느 정도 구현합니다. 내부 압축은 기본값 대신 gzip -9와 동등한 기능을 사용하여 다시 수행됩니다.

가장 좋은 방법은 다양한 압축기를 사용하여 약 1GB의 샘플을 압축하여 어느 것이 가장 적합한지 확인하는 것입니다. 1GB는 컴퓨터에 적합한 크기이므로 대표적으로 사용되어야 합니다.사전 크기.

관련 정보