재귀적 diff 디렉터리를 만듭니다. 참조 및 차이점을 복사하세요. 원래 디렉터리를 다시 만듭니다.

Question

중복 제거를 고려하세요. 새 파일을 삭제하고 업로드하는 대신 서버에서 이러한 파일을 직접 수정할 수 있는 방법이 있습니까? 그렇지 않은 경우 동일한 파일을 직접 심볼릭 링크하거나 하드링크할 수 있습니다. 이렇게 하면 서버의 저장 공간이 절약되고 rsync -H지원되는 하드 링크를 사용할 때 다운로드 문제가 자동으로 해결됩니다. 하드 링크 트랩(하나를 내부 수정하면 실제로 동일한 파일이기 때문에 모두 수정됨)을 알고 있는 한 이것이 가장 좋은 솔루션입니다.

fdupes이를 사용하여 중복 파일을 효율적으로 찾을 수 있습니다 . 여기에는 콘텐츠 측면의 중복이 포함되지만 안타깝게도 파일 이름에 대한 요구 사항은 없습니다. 이것을 사용한 다음 중복된 파일 이름 목록을 필터링하거나 직접 비교할 수 있습니다. 사용 find, stat, cmp.

완전히 개선되지 않은 예:

cd d1
find -type f -exec ./compare.sh d1/{} d2/{}

비교.sh:

if [ -f "$1" -a -f "$2" ]
then
    asize=`stat -c%s "$1"`
    bsize=`stat -c%s "$2"`

    if [ "$asize" == "$bsize" ]
    then
        if cmp "$1" "$2"
        then
            echo IDENTICAL "$1" "$2"
        else
            echo DIFFERENT "$1" "$2"
        fi
    fi
fi

타르볼을 언급했으므로 이를 포함/제외 파일 목록에 표시하여 tar --files-from / --exclude-from.

Answer 1