그래서 나는 읽었다이 위키 기사중복 제거를 위한 btrfs 사용 정보. 그러나 btrfs 중복 제거에 따른 의미 체계는 설명하지 않습니다.
12개의 파일이 있다고 가정해 보겠습니다. 모두 동일한 데이터를 포함하지만 사용자 및 그룹 소유권과 권한(확장 속성, ACL 등)은 다를 수 있습니다.
Btrfs의 중복 제거 기능을 사용하면 디스크 크기를 이전 전체 크기의 약 1/12로 줄일 수 있습니까?
하드 링크는 그 의미가 공유된 메타데이터(소유권, 권한)를 암시하기 때문에 분명히 작동하지 않습니다.
내 커널 버전은 3.16입니다.
답변1
중복 제거는 블록 수준에서 발생합니다. 파일의 콘텐츠가 동일하지만 메타데이터가 다른 경우 시스템이 완전히 중복 제거되었다고 가정하면 전체 콘텐츠가 한 번만 저장됩니다. 중복 제거는 파일이 부분적으로만 동일한 경우에도 공간을 절약할 수 있습니다. 예를 들어, 2바이트 청크가 있고 다음을 포함하는 파일이 있는 경우
file1 = ABCD
file2 = AABAAB
file3 = AAB
그런 다음 5개의 블록에 저장됩니다.
file1 = block1,block2
file2 = block3,block4,block1
file3 = block3,block5
cp -al
동일한 디렉터리(예: 파일 수준 중복 제거 증분 백업 또는 유사한 결과로 인해 동일한 이름과 동일한 inode 번호를 가진 파일이 포함된 디렉터리)가 있는 경우 동일한 블록에 저장할 수도 있습니다.