csv의 열 조건을 기반으로 awk의 평균을 계산합니다.

Question 1

이것을 살펴보십시오:

awk -F, '{date1[$4]+=$1;++date2[$4]}END{for (key in date1) print "Average of",key,"is",date1[key]/date2[key]}' file
Average of 27:May:2017 is 2677.57
Average of 26:May:2017 is 1410.02
Average of 25:May:2017 is 2940.02

설명하다:

-F,: 구분자를 정의합니다. 아니면 될 수 있다awk 'BEGIN{FS=","}...

그런 다음 네 번째 필드를 배열 인덱스/키로 사용 하고 첫 번째 필드를 동일한 배열 위치의 기존 값에 추가할 값으로 사용하는 date1두 개의 배열을 만듭니다 .date2$4$1

따라서 첫 번째 행에 대해 우리는

date1[27:May:2017]+=2415.02
++date2[27:May:2017]--> 값을 1씩 늘립니다. --> 첫 번째 행의 값은 1입니다.

다음 같은 날짜(라인 2)에 대해

date1[27:May:2017]+=2415.02 + 3465.02
++date2[27:May:2017]--> 값을 1씩 늘립니다. --> 값 2(두 번째 줄)

동일한 논리는 날짜가 동일하고 날짜가 다른 모든 행으로 확장됩니다.

마지막으로 루프를 사용하여 for배열의 키를 반복하고 date1(또는 date2두 배열의 키가 동일함 => $4) key발견된 각 값에 대해 (=date$4)를 인쇄 하고 값의 합계 key도 인쇄합니다. date1[key]= $1동일한 날짜 전체에 대해 값을 값 $4으로 나눈 값 date2[key]= 동일한 날짜의 행에서 찾은 숫자의 개수 = 동일합니다 $4.

Answer