csv의 여러 열 조건을 기반으로 awk의 평균을 계산합니다.

Question

~처럼@Archemar다른 배열 키를 사용하고 있음을 지적하십시오. $1"-"$2귀하의 출력과 더 잘 일치 하도록 변경했습니다 .

또 다른 문제는 필드 2와 필드 3이 참조된다는 점인데, 이는 필드 3의 값이 0으로 처리되므로 계산에 좋지 않습니다. 빠른 수정은 모든 따옴표를 $0빈 문자열로 바꾸는 것입니다.

awk -F',' '{
  gsub(/"/, "")
  airline[$1"-"$2]+=$3
  ++count[$1"-"$2]
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

산출:

Average of EN-New York City is 9
Average of AB-Boston is 3.5
Average of EV-Houston is -7
Average of OO-Mystic is 13

"세 번째 열에 있는 모든 양수 값의 평균을 계산한다"는 것은 양수 값만 고려해야 한다는 의미라면 if다음과 같은 문을 추가합니다. 이것이 당신이 원하는 것인지 완전히 확신할 수 없습니다.

awk -F',' '{
  gsub(/"/, "")
  if ($3>0) {
    airline[$1"-"$2]+=$3
    ++count[$1"-"$2]
  }
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

산출:

Average of EN-New York City is 9
Average of AB-Boston is 19
Average of OO-Mystic is 13

Answer 1

~처럼@Archemar다른 배열 키를 사용하고 있음을 지적하십시오. $1"-"$2귀하의 출력과 더 잘 일치 하도록 변경했습니다 .

또 다른 문제는 필드 2와 필드 3이 참조된다는 점인데, 이는 필드 3의 값이 0으로 처리되므로 계산에 좋지 않습니다. 빠른 수정은 모든 따옴표를 $0빈 문자열로 바꾸는 것입니다.

awk -F',' '{
  gsub(/"/, "")
  airline[$1"-"$2]+=$3
  ++count[$1"-"$2]
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

산출:

Average of EN-New York City is 9
Average of AB-Boston is 3.5
Average of EV-Houston is -7
Average of OO-Mystic is 13

"세 번째 열에 있는 모든 양수 값의 평균을 계산한다"는 것은 양수 값만 고려해야 한다는 의미라면 if다음과 같은 문을 추가합니다. 이것이 당신이 원하는 것인지 완전히 확신할 수 없습니다.

awk -F',' '{
  gsub(/"/, "")
  if ($3>0) {
    airline[$1"-"$2]+=$3
    ++count[$1"-"$2]
  }
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

산출:

Average of EN-New York City is 9
Average of AB-Boston is 19
Average of OO-Mystic is 13

csv의 여러 열 조건을 기반으로 awk의 평균을 계산합니다.

답변1

관련 정보