Bash 스크립트를 사용하여 중복 파일 찾기

Question 1

hardlink모든 요구 사항을 충족할 수는 없지만 하드 링크를 만드는 데 사용할 수 있습니다. 디렉터리뿐만 아니라 파일 인수도 허용할 수 있으며 항상 동일한 파일 집합을 첫 번째 파일에 순차적으로 연결하는 것 같습니다. 또한 크기가 0인 파일도 무시합니다.

fdupes필요한 것을 정확하게 선택하지만 실제 파일 매개변수를 출력하는 대신 동일한 파일 그룹과 함께 단락 모드 출력을 출력합니다. 각 그룹은 빈 줄로 끝납니다.

따라서 정확한 선택 항목이 하드 링크되도록 하려면 각 단락을 개별적으로 호출 fdupes해야 합니다 hardlink. 소유자가 다르거나 권한이 다른 두 쌍의 동일한 개체가 존재하는 상황을 피하세요. 물론 파일에 포함된 바이너리 파일은 필터링되어야 합니다.

#!/bin/bash
unset arr i
while IFS= read -r f; do

    # move file to array if binary
    if file -i "$f" | grep -q "charset=binary"; then
        arr[++i]="$f"
    fi
    
    # if end of paragraph and array has files, hardlink and unset array
    if [[ "$f" == "" && "${arr[@]}" ]]; then
        printf "\n => Hardlink for %d files:\n" "$i"
        hardlink -n -c -vv "${arr[@]}"
        unset arr i
    fi

done < <(fdupes -rpio time .)

hardlinkwith -n매개변수는 아무것도 시뮬레이션하고 쓰지 않으므로 위의 내용을 있는 그대로 테스트하고 -n나중에 제거하세요.

또한 줄바꿈이 포함된 파일 이름은 처리되지 않으므로 공백을 사용한 테스트는 괜찮은 것 같습니다.

Answer

hardlink모든 요구 사항을 충족할 수는 없지만 하드 링크를 만드는 데 사용할 수 있습니다. 디렉터리뿐만 아니라 파일 인수도 허용할 수 있으며 항상 동일한 파일 집합을 첫 번째 파일에 순차적으로 연결하는 것 같습니다. 또한 크기가 0인 파일도 무시합니다.

fdupes필요한 것을 정확하게 선택하지만 실제 파일 매개변수를 출력하는 대신 동일한 파일 그룹과 함께 단락 모드 출력을 출력합니다. 각 그룹은 빈 줄로 끝납니다.

따라서 정확한 선택 항목이 하드 링크되도록 하려면 각 단락을 개별적으로 호출 fdupes해야 합니다 hardlink. 소유자가 다르거나 권한이 다른 두 쌍의 동일한 개체가 존재하는 상황을 피하세요. 물론 파일에 포함된 바이너리 파일은 필터링되어야 합니다.

#!/bin/bash
unset arr i
while IFS= read -r f; do

    # move file to array if binary
    if file -i "$f" | grep -q "charset=binary"; then
        arr[++i]="$f"
    fi
    
    # if end of paragraph and array has files, hardlink and unset array
    if [[ "$f" == "" && "${arr[@]}" ]]; then
        printf "\n => Hardlink for %d files:\n" "$i"
        hardlink -n -c -vv "${arr[@]}"
        unset arr i
    fi

done < <(fdupes -rpio time .)

hardlinkwith -n매개변수는 아무것도 시뮬레이션하고 쓰지 않으므로 위의 내용을 있는 그대로 테스트하고 -n나중에 제거하세요.

또한 줄바꿈이 포함된 파일 이름은 처리되지 않으므로 공백을 사용한 테스트는 괜찮은 것 같습니다.

Question 2

드디어 원하는 결과를 얻었습니다. @thanasisp 감사합니다. 이렇게 하려면 fdupes와 rdfind라는 두 가지 프로그램이 필요합니다.

#!/bin/bash
unset arr i; while IFS= read -r f; do if file -i "$f" | grep -q "charset=binary"; then arr[++i]="$f"; fi; if [[ "$f" == "" && "${arr[@]}" ]]; then printf "\n => Hardlink for %d files:\n" "$i";rdfind -makehardlinks true "${arr[@]}" | grep "Total size is" | grep -P "[0-9]+" -o  | head -1 | awk -v count="$i" '{print $1/count;}' | awk '{printf("%s kibibytes saved.\n",$1/1024)}'; unset arr i; fi; done < <(fdupes -rpio time .)

Answer

드디어 원하는 결과를 얻었습니다. @thanasisp 감사합니다. 이렇게 하려면 fdupes와 rdfind라는 두 가지 프로그램이 필요합니다.

#!/bin/bash
unset arr i; while IFS= read -r f; do if file -i "$f" | grep -q "charset=binary"; then arr[++i]="$f"; fi; if [[ "$f" == "" && "${arr[@]}" ]]; then printf "\n => Hardlink for %d files:\n" "$i";rdfind -makehardlinks true "${arr[@]}" | grep "Total size is" | grep -P "[0-9]+" -o  | head -1 | awk -v count="$i" '{print $1/count;}' | awk '{printf("%s kibibytes saved.\n",$1/1024)}'; unset arr i; fi; done < <(fdupes -rpio time .)

Bash 스크립트를 사용하여 중복 파일 찾기

답변1

답변2

관련 정보