csv 파일의 모든 열에서 고유한 값 계산

csv 파일의 모든 열에서 고유한 값 계산

15000개의 행과 16개의 열이 있는 CSV 파일 a.csv가 있습니다. 다른 열에 숫자, 문장, 날짜가 있습니다.

다음과 같습니다.

A, B, C, D
a  b  c  d
e  f  g  h
e  i  j  k
a  m  n  k

각 열의 고유 값을 개별적으로 계산하고 즉시 인쇄하려면 어떻게 해야 합니까?

나는 다음과 같은 출력을 원합니다.

A 2
B 4
C 4
D 3

어떤 조언이나 도움이라도 대단히 감사하겠습니다. 미리 감사드립니다.

답변1

xsv 사용(https://github.com/BurntSushi/xsv)부터 시작

A,B,C,D
a,b,c,d
e,f,g,h
e,i,j,k
a,m,n,k

그리고 달리는 중

xsv stats input.csv --everything | xsv select field,cardinality >output.txt

당신은 할 것

field,cardinality
A,2
B,4
C,4
D,3

관련 정보