유사한 파일에 대한 최고의 압축은 무엇입니까?

유사한 파일에 대한 최고의 압축은 무엇입니까?

바이너리 데이터베이스 덤프와 같은 완전한 오래된 백업이 있습니다. 분명히 큰 차이가 없으므로 전체 백업을 수행하는 것이 가장 현명한 아이디어는 아닙니다. 현재 저는 대부분의 파일이 유사한 내용을 가지고 있다는 사실을 활용할 수 있는 압축 프로그램을 찾고 있습니다.

답변1

파일을 먼저 압축하면 tar cvf my_backup.tar <file list...>어떤 압축 도구도 잘 작동합니다 (다음을 사용하여).

따라서 파일을 tar하고 zip, 7-zip, bzip2 등에 넣으십시오. tar 파일에서 다양한 압축 알고리즘을 시도하여 어느 것이 가장 잘 작동하는지 확인할 수 있습니다.

답변2

저는 7-Zip을 사용하여 행운을 누렸습니다. 마력이 충분하다면 매우 큰 창에서도 달릴 수 있습니다. 유사점을 찾을 수 있도록 원본 파일을 최대한 압축하지 않도록 하세요. (예를 들어, 이기종 환경의 Excel 파일의 경우 xlsx 파일은 저장 시 약간 압축되므로 먼저 내용의 압축을 푼다는 의미입니다. 한때 거의 중복된 600MiB+의 Excel 버전 파일을 몇 백 KiB로 압축할 수 있었습니다.)

관련 정보