grep은 여러 정규 표현식을 찾아 발생 횟수를 계산합니다.

Question 1

아마도 awk가장 빠른 쉘 도구일 것입니다. 당신은 시도 할 수 있습니다:

awk "/$regex1/ { ++r1 }
     /$regex2/ { ++r2 }"'
     END { print "regex1:",r1 "\nregex2:",r2 }' <infile

perl물론, 귀하의 질문과 같이 정규식을 사용해야 한다면 perl그것이 유일한 대답입니다. 그러나 기본 표현식 대신 awk확장 표현식(예: )을 사용합니다 .grep -E

Answer

아마도 awk가장 빠른 쉘 도구일 것입니다. 당신은 시도 할 수 있습니다:

awk "/$regex1/ { ++r1 }
     /$regex2/ { ++r2 }"'
     END { print "regex1:",r1 "\nregex2:",r2 }' <infile

perl물론, 귀하의 질문과 같이 정규식을 사용해야 한다면 perl그것이 유일한 대답입니다. 그러나 기본 표현식 대신 awk확장 표현식(예: )을 사용합니다 .grep -E

Question 2

내가 생각할 수 있는 가장 빠른 해결책은유연한. 테스트되지 않은 뼈대는 다음과 같습니다.

%{
  int count[1000];
%}
%%

regex0  {count[0]++; }
regex1  {count[1]++; }
...
.|\n    {}

%%
int main(){
   yylex();
   // printf the counts;
}

flex는 오토마타를 최적화하고 빠른 C 코드를 생성하는 데 매우 효과적입니다.

정규식이 변경되면 다시 컴파일해야 합니다.

편집하다: 어떤 솔루션을 구현하고 시도해 보면 시간을 지켜보는 것도 흥미로울 것입니다.

Answer