파일에서 중복 콘텐츠 제거

파일에서 중복 콘텐츠 제거

동일한 파일의 백업이 여러 개 있습니다. 이를 증분 백업으로 변환하는 방법이 있습니까?

파일이 완전히 동일하지 않습니다(때때로 타임스탬프가 다르고 때로는 여기 저기에 새 데이터가 추가됨).

새 파일에 대해서만 중복 파일을 검색하고 오래된 파일을 삭제할 수는 없습니다. 때로는 오래된 파일에 대한 데이터가 더 이상 존재하지 않기 때문입니다.

파일에서 중복된 내용을 제거하는 방법을 원합니다. 따라서 모든 파일에는 고유한 데이터가 있습니다. 이상적으로는 병합이 될 것입니다. 왜냐하면 데이터 묶음을 삭제하면 때로는 중복된 형식의 데이터가 있기 때문에 파일이 열리지 않기 때문입니다.

문제는 새 데이터가 순전히 행별로 있거나 때로는 동일한 행에 있는 경우에 발생합니다. 단순히 선이 반복되는 이야기가 아니라, 때로는 선이 반복되는 부분이기도 합니다.

어떤 생각이 있나요?

관련 정보