grep을 사용하여 단어 경계가 있는 고유 식별자 계산

2024-5-27 • tag-icon

text-processing grep

grep을 사용하여 단어 경계가 있는 고유 식별자 계산

수백만 줄을 포함하는 다음 형식의 파일이 있습니다.

KABC XXX 111 222
KDEF XXX 123 456
KGHI XXX 567 890
KABC XXX 124 267
KDEF XXX 190 478
KGHI XXX 095 609
KABC XXX 001 902
KDEF XXX 013 986
KGHI XXX 792 001

등

더 많은 줄이 있지만 이는 단순함을 위한 것입니다. 고유 식별자만 인쇄하는 방법은 무엇입니까? 예를 들어

KABC
KDEF
KGHI

답변1

cut -d' ' -f1 /path/to/file | sort -u

또는

awk '! data[$1] { print $1; data[$1]="seen" }' /path/to/file

답변2

perl -lane '$h{$F[0]}++ or print $F[0]' yourfile

답변3

awk cmd 및 sort 명령 사용

cat file | awk '{print $1}' | sort | uniq -c | sort -n

관련 정보