여러 열로 그룹화 AWK

Question

이것은 숙제처럼 보이므로 완전한 답변은 제공하지 않고 팁과 부분적인 예만 제공하겠습니다.

각 국가별로 최대 및 최소 키와 몸무게, 총 누적 키와 몸무게, 총 누적 메달, 기록 수(나중에 평균을 계산할 수 있도록)를 추적하고 싶을 것입니다.

이렇게 하려면 여러 연관 배열(추적된 값마다 하나씩)을 사용하고 $1(국가)를 배열 키로 사용합니다.

예를 들어:

if ($2 == gender && $3 == sport) {
  count[$1]++;
  medals[$1] += $6 + $7;

  if ($4 > maxH[$1]) {maxH[$1] = $4};
  if ($4 < minH[$1]) {minH[$1] = $4};
  totalH[$1] += $4;

  if ($5 > maxW[$1]) {maxW[$1] = $5};
  if ($5 < minW[$1]) {minW[$1] = $5};
  totalW[$1] += $5;
}

출력 단계와 평균 계산은 여러분에게 맡기겠습니다.

실제로 국가와 성별에 대한 서로 다른 값을 동시에 추적해야 하는 경우 일종의 다차원 배열을 사용할 수 있습니다.

gawk배열의 배열이 지원되므로 기존 awk를 사용하는 것보다 쉽습니다(참조다차원 배열그리고배열의 배열)

예를 들어 국가( $1) 및 성별( $2)을 배열 차원의 키로 사용합니다.

if ($3 == sport) {
  count[$1][$2]++;
  medals[$1][$2] += $6 + $7;

  if ($4 > maxH[$1][$2]) {maxH[$1][$2] = $4};
  if ($4 < minH[$1][$2]) {minH[$1][$2] = $4};
  totalH[$1][$2] += $4;

  if ($5 > maxW[$1][$2]) {maxW[$1][$2] = $5};
  if ($5 < minW[$1][$2]) {minW[$1][$2] = $5};
  totalW[$1][$2] += $5;
}

마지막으로 스포츠, 국가, 성별별로 그룹화해야 하는 경우 $3스포츠( )를 키로 하는 세 번째 배열 차원을 사용할 수 있습니다.

Answer 1