awk/bash의 파일 비교

Question

MD5를 사용해야 하고 입력 파일에 해시 충돌이 있다고 가정할 때(다른 바이너리 파일에는 MD5 이상이 있음) 해싱할 때 무작위 SALT(짧은 무작위 문자열)를 사용하여 충돌이 발생하도록 할 수 있습니다. 체크섬이 다시 변경됩니다.

예를 들어

#!/bin/bash
SALT=$(dd if=/dev/urandom status=none bs=1c count=128)

FILES=("f1" "f2" "f3" "f4" "f5");
for file in "${FILES[@]}"
do
     echo $(echo $SALT | cat - "$file" | md5sum --binary | cut -d' ' -f1) $file
done

그러면 각 파일의 MD5 해시가 계산됩니다.문서, 무작위로 생성된 128바이트를 추가합니다.소금혼합되어 다음과 같은 출력이 생성됩니다.

741eefc6c14d80ee38164a0961cfd200 f1
741eefc6c14d80ee38164a0961cfd200 f2
741eefc6c14d80ee38164a0961cfd200 f3
68441eb38393a75dee94ae089d528633 f4
68441eb38393a75dee94ae089d528633 f5

이 명령을 다시 실행하면 다른 체크섬을 얻게 됩니다(예:소금다양하지만 여전히 중복 파일과 일치합니다.

bc2fdca1b765989b62e507711749c5b4 f1
bc2fdca1b765989b62e507711749c5b4 f2
bc2fdca1b765989b62e507711749c5b4 f3
a31019a6ace1f51b18920bb33d781c97 f4
a31019a6ace1f51b18920bb33d781c97 f5

이제 이 "MD5SUM 파일" 목록을 처리하여 중복 목록을 얻을 수 있습니다.

또한 여러 \0\0 구분 그룹, \0 구분 파일 이름과 같은 형식으로 입력 데이터를 처리하도록 이를 조정해야 합니다. (숙제의 모든 재미를 없애지 않고).

Answer 1