내 컴퓨터에 다른 파일(예 : 내용은 동일하지만 이름이 다른 파일) 이 있는지 foo.pdf
어떻게 알 수 있나요 ?bar.pdf
답변1
작동하는지 알려주세요(곧은 아님).
find /home/user -type f -name "*.pdf" -exec md5sum {} + 2> /dev/null | uniq -f2 -D
답변2
fdupes
영리하게 들리지만 모든 파일을 함께 일치시킵니다. 일치시키려는 파일이 이미 있는 경우 동일한 기술 중 일부를 보다 최적으로 사용할 수 있습니다.
먼저 파일 크기를 얻은 foo.pdf
다음 find
정확한 크기와만 일치하는 명령을 구성할 수 있습니다. 이것은 저렴한 최종 후보 목록이어야 합니다.
그런 다음 각 파일에서 처음 몇 바이트(수백 바이트)를 잘라내어 이를 cmp -s
.
여전히 중복될 수 있는 파일의 경우에는 그렇게 할 수 cksum
있습니다 md5sum
.
하드 링크 복사본을 찾은 경우 inode 번호가 원래 인덱스 번호와 다른지 확인할 수 있습니다.
답변3
이를 사용하여 fdupes
다른 디렉토리에서 중복 파일을 검색할 수 있습니다. 기본 설정은 중복 파일을 빈 줄로 구분된 청크로 나열하는 것입니다.
두 파일이 모두 같은 디렉토리에 있는 경우 dir1
:
fdupes dir1
재귀 검색의 경우 -r
/ --recurse
옵션을 추가합니다.
fdupes -r dir1
여러 디렉터리를 검색하고 특정 디렉터리에 대한 재귀 옵션을 설정할 수 있습니다.
fdupes dir1 dir2 --recurse: dir3
답변4
rmlint -r
린트중복 항목을 찾아 필요한 경우 선택적으로 삭제할 수 있는 매우 빠른 도구입니다.
특징
발견하다…
- ...중복 파일 및 중복 디렉토리.
- ...제거되지 않은 바이너리(예: 디버그 기호가 있는 바이너리)
- ...심볼릭 링크가 깨졌습니다.
- ...빈 파일 및 디렉터리.
- ...사용자 또는/및 그룹 ID가 파일을 손상시켰습니다.
다른 중복 파인더와의 차이점:
- 엄청나게 빠른 속도(과장하지 않음, 약속합니다!)
- 편집증 모드는 해시를 신뢰하지 않는 사람들을 위한 것입니다.
- 다양한 출력 형식.
- 상호 작용이 없습니다.
- 특정 mtime보다 최신 파일만 검색합니다.
- 중복을 처리하는 방법에는 여러 가지가 있습니다.
- 캐싱 및 재생.
- btrfs 지원.
이것지도 시간친절하게 도와드리고 안내해드리겠습니다 ;)