데이터 열 내 범위의 최대값, 평균값, 최소값

Question 1

일방 통행:

sort -k4n,4 file | awk '$2>=43808877 && $2<=43808882{tot+=$4;cnt++;max=$4;min=cnt==1?$4:min}END{print min, max,tot/cnt}'

먼저 sort첫 번째 레코드가 최소값을 갖고 마지막 레코드가 최대값을 갖도록 파일을 4열에 배치합니다. 를 사용하여 awk범위의 숫자를 합산하고 통계를 인쇄합니다.

Answer

일방 통행:

sort -k4n,4 file | awk '$2>=43808877 && $2<=43808882{tot+=$4;cnt++;max=$4;min=cnt==1?$4:min}END{print min, max,tot/cnt}'

먼저 sort첫 번째 레코드가 최소값을 갖고 마지막 레코드가 최대값을 갖도록 파일을 4열에 배치합니다. 를 사용하여 awk범위의 숫자를 합산하고 통계를 인쇄합니다.

Question 2

awk를 좋아하지 않는다면 Miller는 이런 종류의 작업에 적합합니다.

mlr --nidx --repifs filter '$2 >= 43808877 && $2 <= 43808882' then stats1 -f 4 -a max,min,mean file

Answer

awk를 좋아하지 않는다면 Miller는 이런 종류의 작업에 적합합니다.

mlr --nidx --repifs filter '$2 >= 43808877 && $2 <= 43808882' then stats1 -f 4 -a max,min,mean file

Question 3

$ cat tst.awk
$2>=43808877 && $2<=43808882 {
    cnt++
    sum += $4
    min = ( (cnt == 1) || ($4 < min) ? $4 : min )
    max = ( (cnt == 1) || ($4 > max) ? $4 : max )
}
END {
    print max+0
    print min+0
    print (cnt ? sum / cnt : 0)
}

$ awk -f tst.awk file
14
3
8.83333

원하는 범위 내에 레코드가 없더라도 항상 숫자 출력을 얻고 0으로 나누기 오류가 발생하지 않도록 END 섹션의 가드에 유의하십시오.

Answer

$ cat tst.awk
$2>=43808877 && $2<=43808882 {
    cnt++
    sum += $4
    min = ( (cnt == 1) || ($4 < min) ? $4 : min )
    max = ( (cnt == 1) || ($4 > max) ? $4 : max )
}
END {
    print max+0
    print min+0
    print (cnt ? sum / cnt : 0)
}

$ awk -f tst.awk file
14
3
8.83333

원하는 범위 내에 레코드가 없더라도 항상 숫자 출력을 얻고 0으로 나누기 오류가 발생하지 않도록 END 섹션의 가드에 유의하십시오.

Question 4

라이트 버전.

$ awk '/43808877/,/43808882/{t+=$4;c++;if($4>x){x=$4}if($4<n||!length(n)){n=$4}}END{print x,n,t/c}' f
14 3 8.83333
$

Answer

라이트 버전.

$ awk '/43808877/,/43808882/{t+=$4;c++;if($4>x){x=$4}if($4<n||!length(n)){n=$4}}END{print x,n,t/c}' f
14 3 8.83333
$

데이터 열 내 범위의 최대값, 평균값, 최소값

답변1

답변2

답변3

답변4

관련 정보