두 개의 열 파일이 많이 있습니다. 첫 번째 열에는 변수 숫자가 포함되고, 두 번째 열에는 이러한 숫자의 "실제" 값이 포함됩니다.
즉
file 1
41619.442 41586.441
41474.2539 41586.441
41587.539062 41586.441
41623.996094 41586.441
열 2를 기준으로 열 1의 표준 편차를 계산하는 방법은 무엇입니까? 공통 사항을 수정해 보았습니다.
awk '{delta = $1 - avg; avg += delta / NR; mean2 += delta * ($1 - avg); } END { print sqrt(mean2 / NR); }'
얻기 위해
awk '{a=$2}{delta = $1 - a; a += delta / NR; a*2 += delta * ($1 - a); } END { print sqrt(a*2 / NR); }' 11978.08984 >> test1.txt
하지만 좋은 결과는 없습니다.
답변1
답변2
이와 같은 질문이 있는 경우 다음을 살펴보세요 datamash
.
datamash -W pstdev 1 < file1
다른 많은 기능 중에서 datamash에는
pstdev 1
= 열 1의 모집단 표준편차sstdev 1
= 열 1의 표본 표준편차