btrfs의 중복 제거 의미 - 다른 메타데이터, 동일한 파일 데이터

btrfs의 중복 제거 의미 - 다른 메타데이터, 동일한 파일 데이터

그래서 나는 읽었다이 위키 기사중복 제거를 위한 btrfs 사용 정보. 그러나 btrfs 중복 제거에 따른 의미 체계는 설명하지 않습니다.

12개의 파일이 있다고 가정해 보겠습니다. 모두 동일한 데이터를 포함하지만 사용자 및 그룹 소유권과 권한(확장 속성, ACL 등)은 다를 수 있습니다.

Btrfs의 중복 제거 기능을 사용하면 디스크 크기를 이전 전체 크기의 약 1/12로 줄일 수 있습니까?

하드 링크는 그 의미가 공유된 메타데이터(소유권, 권한)를 암시하기 때문에 분명히 작동하지 않습니다.

내 커널 버전은 3.16입니다.

답변1

중복 제거는 블록 수준에서 발생합니다. 파일의 콘텐츠가 동일하지만 메타데이터가 다른 경우 시스템이 완전히 중복 제거되었다고 가정하면 전체 콘텐츠가 한 번만 저장됩니다. 중복 제거는 파일이 부분적으로만 동일한 경우에도 공간을 절약할 수 있습니다. 예를 들어, 2바이트 청크가 있고 다음을 포함하는 파일이 있는 경우

file1 = ABCD
file2 = AABAAB
file3 = AAB

그런 다음 5개의 블록에 저장됩니다.

file1 = block1,block2
file2 = block3,block4,block1
file3 = block3,block5

cp -al동일한 디렉터리(예: 파일 수준 중복 제거 증분 백업 또는 유사한 결과로 인해 동일한 이름과 동일한 inode 번호를 가진 파일이 포함된 디렉터리)가 있는 경우 동일한 블록에 저장할 수도 있습니다.

관련 정보