번호가 매겨진 줄이 있는 파일이 있습니다. 이 숫자는 각 줄의 처음 7칸을 차지합니다. 행의 나머지 부분에 중복 항목이 있는지 확인하고 중복 항목만 출력하고 싶습니다.
예를 들어 내 파일은 다음과 같습니다.
1 abcde
2 12345789
3 6789
4 000000
5 abcde
이 경우 내 출력은 다음과 같습니다.
1 abcde
5 abcde
물론 출력 형식은 상관없지만, 반복되는 문자열을 서로 일치시켜서 좀 더 쉽게 찾을 수 있으면 좋을 것 같습니다.
저는 리눅스를 사용하고 있습니다.
답변1
sort
파일의 두 번째 필드를 입력하고 GNU에게 uniq
처음 7개 문자( )를 건너뛰고 반복되는 줄( ) -s 7
을 인쇄하도록 지시합니다 .-D
$ sort -k2,2 foo | uniq -Ds 7
1 abcde
5 abcde