파일의 필드에 대한 고유 값 계산

Question 1

좋아, 파일이 쉼표 구분 기호 ","로 구분된 필드가 있는 텍스트 파일이라고 가정해 보겠습니다. 어떤 필드가 'transactionid'어디에 있는지도 알 수 있습니다 . 귀하의 'transactionid'필드가 일곱 번째 필드라고 가정해 보겠습니다 .

awk -F ',' '{print $7}' text_file | sort | uniq -c

그러면 일곱 번째 필드에서 고유한/고유한 발생 횟수가 계산되고 결과가 인쇄됩니다.

Answer

좋아, 파일이 쉼표 구분 기호 ","로 구분된 필드가 있는 텍스트 파일이라고 가정해 보겠습니다. 어떤 필드가 'transactionid'어디에 있는지도 알 수 있습니다 . 귀하의 'transactionid'필드가 일곱 번째 필드라고 가정해 보겠습니다 .

awk -F ',' '{print $7}' text_file | sort | uniq -c

그러면 일곱 번째 필드에서 고유한/고유한 발생 횟수가 계산되고 결과가 인쇄됩니다.

Question 2

가장 세련된 접근 방식은 아닐 수도 있지만 다음과 같이 하면 작동합니다.

awk '{print $1}' your_file | sort | uniq | wc -l

$1구문 분석할 필드에 해당하는 숫자는 어디에 있습니까?

Answer

가장 세련된 접근 방식은 아닐 수도 있지만 다음과 같이 하면 작동합니다.

awk '{print $1}' your_file | sort | uniq | wc -l

$1구문 분석할 필드에 해당하는 숫자는 어디에 있습니까?

Question 3

파일을 정렬할 필요가 없습니다.. ( uniq파일을 정렬해야 합니다.)
이 awk 스크립트는 필드가 공백으로 구분된 첫 번째 필드라고 가정합니다.

awk 'a[$1] == "" { a[$1]="X" } END { print length(a) }' file

Answer

파일을 정렬할 필요가 없습니다.. ( uniq파일을 정렬해야 합니다.)
이 awk 스크립트는 필드가 공백으로 구분된 첫 번째 필드라고 가정합니다.

awk 'a[$1] == "" { a[$1]="X" } END { print length(a) }' file

관련 정보