파일이 주어지면 해당 파일이 복사된 하위 디렉터리에서 위치를 찾습니다.

Question 1

나는 당신에게 제안합니다 - 당신의 소프트웨어에 따라 - fslint, duff, fdupes, dmerge, rmlint, rdfind - 그들 모두는 fdupes 또는 dupseek보다 더 빨리 쌍둥이를 찾을 수 있을 것입니다.

나는 다음을 실행할 것이다:

$ find /path -type f -printf "%p - %s\n" | sort -nr -k3 | uniq -D -f1

Answer

나는 당신에게 제안합니다 - 당신의 소프트웨어에 따라 - fslint, duff, fdupes, dmerge, rmlint, rdfind - 그들 모두는 fdupes 또는 dupseek보다 더 빨리 쌍둥이를 찾을 수 있을 것입니다.

나는 다음을 실행할 것이다:

$ find /path -type f -printf "%p - %s\n" | sort -nr -k3 | uniq -D -f1

Question 2

myfile=/full/path/to/data.txt

mysearchpath=/my/search/path/root/directory

for file in $(find ${mysearchpath} -type f)
do
  diff ${myfile} ${file} > /dev/null 
  result=${?}
  if [ $result -eq 0 ]
  then
    echo "Identical file found at ${file}"
  fi
done

이는 매우 비용이 많이 드는 접근 방식이지만(컴퓨팅 리소스 측면에서, 특히 다른 작업을 수행하는 다른 사람들과 이 서버를 공유하는 경우). 이러한 파일의 체크섬을 생성할 수 있으며 특정 날짜에 추가된 파일의 체크섬을 생성하는 작업을 실행하고 이를 플랫 파일에 넣을 수 있습니다. 파일을 찾아야 할 경우 파일의 체크섬을 생성하고 이를 체크섬 데이터베이스와 비교합니다. 생각할 거리만 있으면 됩니다.

Answer

myfile=/full/path/to/data.txt

mysearchpath=/my/search/path/root/directory

for file in $(find ${mysearchpath} -type f)
do
  diff ${myfile} ${file} > /dev/null 
  result=${?}
  if [ $result -eq 0 ]
  then
    echo "Identical file found at ${file}"
  fi
done

이는 매우 비용이 많이 드는 접근 방식이지만(컴퓨팅 리소스 측면에서, 특히 다른 작업을 수행하는 다른 사람들과 이 서버를 공유하는 경우). 이러한 파일의 체크섬을 생성할 수 있으며 특정 날짜에 추가된 파일의 체크섬을 생성하는 작업을 실행하고 이를 플랫 파일에 넣을 수 있습니다. 파일을 찾아야 할 경우 파일의 체크섬을 생성하고 이를 체크섬 데이터베이스와 비교합니다. 생각할 거리만 있으면 됩니다.

Question 3

정기적으로 확인해야 하는 사항인 경우 cron 작업을 설정하여 파일의 md5 해시 다이제스트를 생성할 수 있습니다.

echo > $digest_file; find $search_path -type f | xargs md5sum >> $digest_file

파일이 복사된 이후에 이것이 실행되었다고 가정하면 먼저 알려진 파일의 해시를 찾은 다음 목록을 확인하여 동일한 해시를 가진 다른 파일이 있는지 확인하십시오. 물론 성능은 검색 경로에 있는 파일의 수와 크기에 따라 달라집니다.

이것의 또 다른 이점은 각 실행 전에 다이제스트를 복사하고 이전 다이제스트와 새 다이제스트를 비교하면 데이터 손상/변경을 감지할 수 있다는 것입니다.

Answer

정기적으로 확인해야 하는 사항인 경우 cron 작업을 설정하여 파일의 md5 해시 다이제스트를 생성할 수 있습니다.

echo > $digest_file; find $search_path -type f | xargs md5sum >> $digest_file

파일이 복사된 이후에 이것이 실행되었다고 가정하면 먼저 알려진 파일의 해시를 찾은 다음 목록을 확인하여 동일한 해시를 가진 다른 파일이 있는지 확인하십시오. 물론 성능은 검색 경로에 있는 파일의 수와 크기에 따라 달라집니다.

이것의 또 다른 이점은 각 실행 전에 다이제스트를 복사하고 이전 다이제스트와 새 다이제스트를 비교하면 데이터 손상/변경을 감지할 수 있다는 것입니다.

Question 4

그리고 :findcmp

find . -type f -exec sh -c 'cmp -s data.txt "$0" 2>/dev/null && echo $0' {} \;

검색을 제한하기 위해 더 많은 기준을 추가할 수 있습니다.

Answer

그리고 :findcmp

find . -type f -exec sh -c 'cmp -s data.txt "$0" 2>/dev/null && echo $0' {} \;

검색을 제한하기 위해 더 많은 기준을 추가할 수 있습니다.

파일이 주어지면 해당 파일이 복사된 하위 디렉터리에서 위치를 찾습니다.

답변1

답변2

답변3

답변4

관련 정보