정렬해야 할 파일이 너무 많습니다. 이름은 같지만 내용이 다른 파일이 많고, 내용은 같지만 파일 이름이 다릅니다.
파일에 대한 체크섬 생성을 사용하려고 하는데 md5sum
알아야 할 사항이 있습니다. 두 개의 서로 다른 파일(예: 서로 다른 콘텐츠)이 동일한 체크섬을 생성할 수 있습니까?
만약 그렇다면, 그런 일이 일어날 가능성은 얼마나 됩니까?
서로 다른 두 개의 체크섬 프로그램을 사용하여 두 개의 체크섬을 생성하는 것이 가능합니까? 두 개의 서로 다른 파일이 두 체크섬 프로그램에 대해 동일한 체크섬을 생성할 수 있다고 가정하고 두 프로그램 모두 동시에 발생하지 않습니까? ?
답변1
내용은 동일하지만 파일 이름이 다른 두 파일:(파일 1그리고파일 2):
cat file1
this is a simple file
cat file2
this is a simple file
md5sum file1
7de45bf879db49de7e2eacea23e6c165 file1
md5sum file2
7de45bf879db49de7e2eacea23e6c165 file2
내용은 다르지만 파일 이름은 같은 두 파일:(파일 1그리고파일 1)
cat file1
this is a simple file
cat file1
this is a simple file with extra contents
md5sum file1 #first file1
7de45bf879db49de7e2eacea23e6c165 file1
md5sum file1 #second file1
c7c8f3fd9ddd7a926c31416a69063e4e file1
~에서위키피디아입구,
그러나 실제로는 동일한 해시를 갖도록 특별히 생성되지 않는 한 동일하지 않은 두 파일이 동일한 MD5 해시를 가질 가능성이 거의 없습니다.
하지만,MD5알고리즘에는 자체 결함이 있습니다.
그러나 MD5 충돌이 발생하기 쉽고 파일을 만든 사람이 잠재적으로 동일한 체크섬을 사용하여 두 번째 파일을 만들 수 있기 때문에 이 기술은 일부 형태의 악의적인 변조로부터 보호할 수 없습니다. 또한 어떤 경우에는 체크섬을 신뢰할 수 없습니다(예: 다운로드한 파일과 동일한 채널을 통해 얻은 경우). 이 경우 MD5는 오류 검사만 제공할 수 있습니다. 손상되거나 잘못된 전체 다운로드를 식별합니다. 더 큰 파일을 다운로드하는 중입니다.
충돌이 발생하기 쉽지 않기 때문에 sha1을 사용하여 체크섬을 계산하는 것이 좋습니다.모래 1연산. 보시다시피 sha1 체크섬을 생성하는 것은 매우 간단합니다.여기.