파일이 중복되었지만 이름이 다른지 어떻게 알 수 있나요? [복사]

파일이 중복되었지만 이름이 다른지 어떻게 알 수 있나요? [복사]

내 컴퓨터에 다른 파일(예 : 내용은 동일하지만 이름이 다른 파일) 이 있는지 foo.pdf어떻게 알 수 있나요 ?bar.pdf

답변1

작동하는지 알려주세요(곧은 아님).

find /home/user -type f -name "*.pdf" -exec md5sum {} + 2> /dev/null | uniq -f2 -D

답변2

fdupes영리하게 들리지만 모든 파일을 함께 일치시킵니다. 일치시키려는 파일이 이미 있는 경우 동일한 기술 중 일부를 보다 최적으로 사용할 수 있습니다.

먼저 파일 크기를 얻은 foo.pdf다음 find정확한 크기와만 일치하는 명령을 구성할 수 있습니다. 이것은 저렴한 최종 후보 목록이어야 합니다.

그런 다음 각 파일에서 처음 몇 바이트(수백 바이트)를 잘라내어 이를 cmp -s.

여전히 중복될 수 있는 파일의 경우에는 그렇게 할 수 cksum있습니다 md5sum.

하드 링크 복사본을 찾은 경우 inode 번호가 원래 인덱스 번호와 다른지 확인할 수 있습니다.

답변3

이를 사용하여 fdupes다른 디렉토리에서 중복 파일을 검색할 수 있습니다. 기본 설정은 중복 파일을 빈 줄로 구분된 청크로 나열하는 것입니다.

두 파일이 모두 같은 디렉토리에 있는 경우 dir1:

fdupes dir1

재귀 검색의 경우 -r/ --recurse옵션을 추가합니다.

fdupes -r dir1

여러 디렉터리를 검색하고 특정 디렉터리에 대한 재귀 옵션을 설정할 수 있습니다.

fdupes dir1 dir2 --recurse: dir3

답변4

rmlint -r

린트중복 항목을 찾아 필요한 경우 선택적으로 삭제할 수 있는 매우 빠른 도구입니다.

특징

발견하다…

  • ...중복 파일 및 중복 디렉토리.
  • ...제거되지 않은 바이너리(예: 디버그 기호가 있는 바이너리)
  • ...심볼릭 링크가 깨졌습니다.
  • ...빈 파일 및 디렉터리.
  • ...사용자 또는/및 그룹 ID가 파일을 손상시켰습니다.

다른 중복 파인더와의 차이점:

  • 엄청나게 빠른 속도(과장하지 않음, 약속합니다!)
  • 편집증 모드는 해시를 신뢰하지 않는 사람들을 위한 것입니다.
  • 다양한 출력 형식.
  • 상호 작용이 없습니다.
  • 특정 mtime보다 최신 파일만 검색합니다.
  • 중복을 처리하는 방법에는 여러 가지가 있습니다.
  • 캐싱 및 재생.
  • btrfs 지원.

이것지도 시간친절하게 도와드리고 안내해드리겠습니다 ;)

관련 정보