패턴과 일치하는 가장 높은 번호의 행을 유지하는 방법은 무엇입니까?

Question 1

나는 이것을 시도할 osx가 없지만 awk내 Linux gnu awk에서 작동합니다.

awk '
{ n = match($0, /[0-9]+ *$/);
  if(n){
    word = substr($0, 1, n - 1); num = 0 + substr($0, n);
    if(!(word in max) || max[word] < num) max[word] = num
  }
}
END{ for(word in max)print word max[word] } '

각 줄에서 정규식 패턴의 줄에서 시작 인덱스를 찾습니다. 이 인덱스는 선택적 후행 공백이 있는 숫자입니다. 해당 인덱스의 줄을 단어 부분과 숫자 부분으로 나눕니다. 숫자형 문자열에 0을 더하여 숫자로 변환합니다. 단어로 색인된 연관 배열은 가장 큰 숫자를 보유합니다.

Answer

나는 이것을 시도할 osx가 없지만 awk내 Linux gnu awk에서 작동합니다.

awk '
{ n = match($0, /[0-9]+ *$/);
  if(n){
    word = substr($0, 1, n - 1); num = 0 + substr($0, n);
    if(!(word in max) || max[word] < num) max[word] = num
  }
}
END{ for(word in max)print word max[word] } '

각 줄에서 정규식 패턴의 줄에서 시작 인덱스를 찾습니다. 이 인덱스는 선택적 후행 공백이 있는 숫자입니다. 해당 인덱스의 줄을 단어 부분과 숫자 부분으로 나눕니다. 숫자형 문자열에 0을 더하여 숫자로 변환합니다. 단어로 색인된 연관 배열은 가장 큰 숫자를 보유합니다.

Question 2

주어진 접두사에 해당하는 행이 항상 그룹화되어 있는 경우(예: 모든 행이 stringNNN함께 있는 등) awk를 사용하고 동일한 접두사가 있는 행을 버퍼링한 다음 가장 높은 접미사가 있는 행을 인쇄할 수 있습니다.

awk '{
    match($0, /[0-9]*/);
    current_prefix = substr($0, 1, RSTART);
    current_number = substr($0, RSTART, RLENGTH);
    if (current_prefix == previous_prefix) {
        if (current_number > max_number) max_number = current_number;
    } else {
        if (NR != 1) print previous_prefix max_number;
        previous_prefix = current_prefix;
        max_number = current_number;
    }
}
END { if (NR != 1) print previous_prefix max_number; }'

주어진 접두사에 해당하는 줄이 항상 그룹화되어 있지 않은 경우(예: foo1 bar1 foo2) 먼저 파일을 정렬할 수 있습니다.

Answer

주어진 접두사에 해당하는 행이 항상 그룹화되어 있는 경우(예: 모든 행이 stringNNN함께 있는 등) awk를 사용하고 동일한 접두사가 있는 행을 버퍼링한 다음 가장 높은 접미사가 있는 행을 인쇄할 수 있습니다.

awk '{
    match($0, /[0-9]*/);
    current_prefix = substr($0, 1, RSTART);
    current_number = substr($0, RSTART, RLENGTH);
    if (current_prefix == previous_prefix) {
        if (current_number > max_number) max_number = current_number;
    } else {
        if (NR != 1) print previous_prefix max_number;
        previous_prefix = current_prefix;
        max_number = current_number;
    }
}
END { if (NR != 1) print previous_prefix max_number; }'

주어진 접두사에 해당하는 줄이 항상 그룹화되어 있지 않은 경우(예: foo1 bar1 foo2) 먼저 파일을 정렬할 수 있습니다.

패턴과 일치하는 가장 높은 번호의 행을 유지하는 방법은 무엇입니까?

답변1

답변2

관련 정보