전체 프로그램

Question 1

모든 열에 루프가 필요합니다

{ for(i=1;i<=NF;i++) ...

그리고 배열

... total[i]+=$i ; sq[i]+=$i*$i ; }

결과적으로 (평균적으로) 유사한 명령줄이 생성됩니다.

awk '{ for(i=1;i<=NF;i++) total[i]+=$i ; } 
    END { for(i=1;i<=NF;i++) printf "%f ",total[i]/NR ;}'

전체 프로그램

평균과 분산을 계산하기 위해 awk를 사용했지만 결과를 얻지 못했습니다.

 { for(i=1;i<=NF;i++) {total[i]+=$i ; sq[i]+=$i*$i ; } }
END {

   for(i=1;i<=NF;i++) printf "%f ",total[i]/NR ;
   printf "\n" ;
   for(i=1;i<=NF;i++) printf "%f ",sq[i]/NR-(total[i]/NR)**2 ;
   printf "\n" ;
}

Answer

모든 열에 루프가 필요합니다

{ for(i=1;i<=NF;i++) ...

그리고 배열

... total[i]+=$i ; sq[i]+=$i*$i ; }

결과적으로 (평균적으로) 유사한 명령줄이 생성됩니다.

awk '{ for(i=1;i<=NF;i++) total[i]+=$i ; } 
    END { for(i=1;i<=NF;i++) printf "%f ",total[i]/NR ;}'

전체 프로그램

평균과 분산을 계산하기 위해 awk를 사용했지만 결과를 얻지 못했습니다.

 { for(i=1;i<=NF;i++) {total[i]+=$i ; sq[i]+=$i*$i ; } }
END {

   for(i=1;i<=NF;i++) printf "%f ",total[i]/NR ;
   printf "\n" ;
   for(i=1;i<=NF;i++) printf "%f ",sq[i]/NR-(total[i]/NR)**2 ;
   printf "\n" ;
}

Question 2

"C" 방법,문서. 아마도 효율적이거나 깨끗하지는 않지만 읽기가 더 쉬울 것입니다. NxM 공백으로 구분된 요소를 포함하는 데이터 파일의 각 열의 평균과 분산을 계산합니다.

#!/bin/awk -f

BEGIN { } {
    if (max_nf < NF)
        max_nf = NF
    max_nr = NR
    for (x = 1; x <= NF; x++)
        mat[x, NR] = $x
} END {
    for (x = 1; x <= max_nf; x++) {
        mean = 0.0
        var = 0.0
        for (y = 1; y <= max_nr; y++) {
            var += (y - 1) * (mat[x, y] - mean) * (mat[x, y] - mean) / y
            mean += (mat[x, y] - mean) / y
        }
        printf("%f %f\n", mean, var / (max_nr - 1))
    } 
}

예제를 실행하세요:

./ColVarAndMean.awk dataset.csv > output.dat && cat output.dat 
1.625000 0.839286 
1.625000 1.410714 
12.000000 0.285714 
4.500000 6.000000 
0.250000 0.214286 
0.375000 0.553571 
478791.500000 174812449479.714294

Answer

"C" 방법,문서. 아마도 효율적이거나 깨끗하지는 않지만 읽기가 더 쉬울 것입니다. NxM 공백으로 구분된 요소를 포함하는 데이터 파일의 각 열의 평균과 분산을 계산합니다.

#!/bin/awk -f

BEGIN { } {
    if (max_nf < NF)
        max_nf = NF
    max_nr = NR
    for (x = 1; x <= NF; x++)
        mat[x, NR] = $x
} END {
    for (x = 1; x <= max_nf; x++) {
        mean = 0.0
        var = 0.0
        for (y = 1; y <= max_nr; y++) {
            var += (y - 1) * (mat[x, y] - mean) * (mat[x, y] - mean) / y
            mean += (mat[x, y] - mean) / y
        }
        printf("%f %f\n", mean, var / (max_nr - 1))
    } 
}

예제를 실행하세요:

./ColVarAndMean.awk dataset.csv > output.dat && cat output.dat 
1.625000 0.839286 
1.625000 1.410714 
12.000000 0.285714 
4.500000 6.000000 
0.250000 0.214286 
0.375000 0.553571 
478791.500000 174812449479.714294

Question 3

awk -F ',' '{print;x+=$2}END{print "MEAN" x/NR}' filename.csv

두 번째 열 은 $2변수에 값을 저장할 수 있는 NR레코드 수 입니다.$2x

Answer

awk -F ',' '{print;x+=$2}END{print "MEAN" x/NR}' filename.csv

두 번째 열 은 $2변수에 값을 저장할 수 있는 NR레코드 수 입니다.$2x

전체 프로그램

답변1

전체 프로그램

답변2

답변3

관련 정보