tar/gzip이 두 개의 유사한 대형 디렉토리를 압축할 수 없는 이유는 무엇입니까?

Question

예, tar는 파일을 확장자별로 정렬하지 않고(더 높은 압축률을 달성하는 데 도움이 될 수 있음) gzip비교적 적당한 사전(32KB)을 사용하는 매우 오래된 압축 알고리즘이기 때문에 귀하의 추론은 정확합니다.

xz또는 대신 사용해 보세요 p7zip.

다음은 Linux에서 가장 높은 압축 비율을 달성할 수 있는 압축 문자열입니다.

7za a -mx=9 -myx=9 -mfb=273 -bt -slp -mmt4 -md=1536m -mqs archive.7z [list of files]

이를 위해서는 많은 메모리(최소 32GB RAM)가 필요합니다. 제거 -mmmt4하고 사전 크기를 1024m로 줄이면 16GB이면 충분합니다.

tar몇 년 전에 저는 다음과 같은 스크립트를 작성했습니다 .https://github.com/birdie-github/useful-scripts/blob/master/tar_sorted

Answer 1

예, tar는 파일을 확장자별로 정렬하지 않고(더 높은 압축률을 달성하는 데 도움이 될 수 있음) gzip비교적 적당한 사전(32KB)을 사용하는 매우 오래된 압축 알고리즘이기 때문에 귀하의 추론은 정확합니다.

xz또는 대신 사용해 보세요 p7zip.

다음은 Linux에서 가장 높은 압축 비율을 달성할 수 있는 압축 문자열입니다.

7za a -mx=9 -myx=9 -mfb=273 -bt -slp -mmt4 -md=1536m -mqs archive.7z [list of files]

이를 위해서는 많은 메모리(최소 32GB RAM)가 필요합니다. 제거 -mmmt4하고 사전 크기를 1024m로 줄이면 16GB이면 충분합니다.

tar몇 년 전에 저는 다음과 같은 스크립트를 작성했습니다 .https://github.com/birdie-github/useful-scripts/blob/master/tar_sorted

관련 정보