![알려진 평균을 사용하여 표준편차 계산](https://linux55.com/image/90176/%EC%95%8C%EB%A0%A4%EC%A7%84%20%ED%8F%89%EA%B7%A0%EC%9D%84%20%EC%82%AC%EC%9A%A9%ED%95%98%EC%97%AC%20%ED%91%9C%EC%A4%80%ED%8E%B8%EC%B0%A8%20%EA%B3%84%EC%82%B0.png)
두 개의 열 파일이 많이 있습니다. 첫 번째 열에는 변수 숫자가 포함되고, 두 번째 열에는 이러한 숫자의 "실제" 값이 포함됩니다.
즉
file 1
41619.442 41586.441
41474.2539 41586.441
41587.539062 41586.441
41623.996094 41586.441
열 2를 기준으로 열 1의 표준 편차를 계산하는 방법은 무엇입니까? 공통 사항을 수정해 보았습니다.
awk '{delta = $1 - avg; avg += delta / NR; mean2 += delta * ($1 - avg); } END { print sqrt(mean2 / NR); }'
얻기 위해
awk '{a=$2}{delta = $1 - a; a += delta / NR; a*2 += delta * ($1 - a); } END { print sqrt(a*2 / NR); }' 11978.08984 >> test1.txt
하지만 좋은 결과는 없습니다.
답변1
답변2
이와 같은 질문이 있는 경우 다음을 살펴보세요 datamash
.
datamash -W pstdev 1 < file1
다른 많은 기능 중에서 datamash에는
pstdev 1
= 열 1의 모집단 표준편차sstdev 1
= 열 1의 표본 표준편차