누락된 데이터 확인 시 동일한 ID를 가진 모든 행의 열에 대한 평균값

Question

WD 필드가 비어 있지 않은 경우에만 개수를 추가할 수 있습니다.

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

바퀴를 재발명하고 싶지 않다면 다음을 사용할 수 있습니다.밀러, stats1원하는 방식으로 빈 필드를 처리하는 것 같습니다.

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

Miller 버전의 Ubuntu는 universe저장소에서 사용할 수 있습니다.

Answer 1

WD 필드가 비어 있지 않은 경우에만 개수를 추가할 수 있습니다.

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

바퀴를 재발명하고 싶지 않다면 다음을 사용할 수 있습니다.밀러, stats1원하는 방식으로 빈 필드를 처리하는 것 같습니다.

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

Miller 버전의 Ubuntu는 universe저장소에서 사용할 수 있습니다.

누락된 데이터 확인 시 동일한 ID를 가진 모든 행의 열에 대한 평균값

답변1

관련 정보