파일의 고유 줄 수를 얻는 방법은 무엇입니까?

Question 1

순서가 중요한 경우:

awk '!($1 in sum) {f[n++] = $1}
     {sum[$1] += $2}
     END {for (i = 0; i < n; i++) print f[i], sum[f[i]]}' < file

그렇지 않은 경우 다음과 같이 단순화할 수 있습니다.

awk '{sum[$1] += $2}
     END {for (f in sum) print f, sum[f]}' < file

Answer

순서가 중요한 경우:

awk '!($1 in sum) {f[n++] = $1}
     {sum[$1] += $2}
     END {for (i = 0; i < n; i++) print f[i], sum[f[i]]}' < file

그렇지 않은 경우 다음과 같이 단순화할 수 있습니다.

awk '{sum[$1] += $2}
     END {for (f in sum) print f, sum[f]}' < file

Question 2

사용 datamash:

datamash groupby 1 sum 2 <infile.txt

Answer

사용 datamash:

datamash groupby 1 sum 2 <infile.txt

Question 3

perl -lane '
   exists $h{$F[0]} or push @h, $F[0];
   $h{$F[0]} += $F[1];
   END { print "$_\t$h{$_}" for @h; }
' yourfile

위의 코드는 키 입력이 발생한 순서대로 인쇄합니다. 배열은 키의 순서를 유지하는 반면, 해시는 각 키에 해당하는 합계를 유지합니다.

Answer

perl -lane '
   exists $h{$F[0]} or push @h, $F[0];
   $h{$F[0]} += $F[1];
   END { print "$_\t$h{$_}" for @h; }
' yourfile

위의 코드는 키 입력이 발생한 순서대로 인쇄합니다. 배열은 키의 순서를 유지하는 반면, 해시는 각 키에 해당하는 합계를 유지합니다.

관련 정보