
이 포럼 덕분에 파일 이름과 해시 값이 포함된 대용량 텍스트 파일을 처리할 수 있었고 다음과 같이 동일한 해시 값을 가진 파일 목록을 얻을 수 있었습니다.
file_35.txt 8208ad321576b521b23b07b9ba598e5c43b03ec4172c96fdbd35a858ec205ae6
file_87.txt 8208ad321576b521b23b07b9ba598e5c43b03ec4172c96fdbd35a858ec205ae6
file_32.txt aaf6b8c4a95d0e8f191784943ba1ea5c0b4d4baab733efe8ceb8b35478b6afd2
file_58.txt aaf6b8c4a95d0e8f191784943ba1ea5c0b4d4baab733efe8ceb8b35478b6afd2
file_89.txt aaf6b8c4a95d0e8f191784943ba1ea5c0b4d4baab733efe8ceb8b35478b6afd2
중복된 해시가 포함된 행을 제거하여 다음과 같은 고유한 해시가 포함된 텍스트 파일을 만들고 싶습니다.
file_35.txt 8208ad321576b521b23b07b9ba598e5c43b03ec4172c96fdbd35a858ec205ae6
file_32.txt aaf6b8c4a95d0e8f191784943ba1ea5c0b4d4baab733efe8ceb8b35478b6afd2
이 작업이 완료되면 저장하고 삭제하려는 파일을 이동하고 삭제하는 스크립트를 만들 수 있습니다.
답변1
파일이 이미 정렬되어 있는 경우 다음과 같이 하세요.
uniq --skip-field=1 file
그렇지 않으면 먼저 파일을 정렬한 후 다음을 사용할 수 있습니다 uniq
.
sort -k2 file | uniq --skip-field=1
산출:
file_35.txt 8208ad321576b521b23b07b9ba598e5c43b03ec4172c96fdbd35a858ec205ae6
file_32.txt aaf6b8c4a95d0e8f191784943ba1ea5c0b4d4baab733efe8ceb8b35478b6afd2