awk를 사용하여 각 ID에 대한 측정값의 표준 편차를 어떻게 인쇄할 수 있나요?

Question

R이나 datamash가 더 나은 선택일 수 있습니다!

표준편차의 정의에 따르면 다음과 같이 할 수 있습니다.

$ cat my-sd
#!/usr/bin/awk -f

    { s[$1]["sum"] += $2 ; 
      n = s[$1]["oco"] ++; 
      v[$1][n]=$2  }

END { for(x in s){ 
         m=s[x]["sum"]/s[x]["oco"]; 
         s1=0;
         for(y in v[x]){
            s1 += (v[x][y]-m)*(v[x][y]-m);}
         print x, sqrt(s1/s[x]["oco"])}
    }

$ my-sd example
101 39.6074
104 44.9691
107 35.6195

Answer 1

R이나 datamash가 더 나은 선택일 수 있습니다!

표준편차의 정의에 따르면 다음과 같이 할 수 있습니다.

$ cat my-sd
#!/usr/bin/awk -f

    { s[$1]["sum"] += $2 ; 
      n = s[$1]["oco"] ++; 
      v[$1][n]=$2  }

END { for(x in s){ 
         m=s[x]["sum"]/s[x]["oco"]; 
         s1=0;
         for(y in v[x]){
            s1 += (v[x][y]-m)*(v[x][y]-m);}
         print x, sqrt(s1/s[x]["oco"])}
    }

$ my-sd example
101 39.6074
104 44.9691
107 35.6195

awk를 사용하여 각 ID에 대한 측정값의 표준 편차를 어떻게 인쇄할 수 있나요?

답변1

관련 정보