비활성화된 줄을 포함하지 않는 로그 파일에서 쿼리 추출

Question 1

grep먼저, 호출이 필요하지 않다는 점에 유의하세요. awk호출에 원활하게 통합됩니다.

<logfile awk '/endQuery/ {print $3 " " $1}'

awk 단계에서 금지된 쿼리를 필터링할 수 있습니다. 진행 중인 쿼리를 배열에 저장하고, 금지된 경우 제거하고, 금지되지 않은 쿼리만 인쇄합니다.

<logfile awk '
    $2 == "startQuery" {q[$1]=1}        # store the names of active queries
    q[$1] && /banned/ {delete q[$1]}    # delete banned queries
    $2 == "endQuery" {
        if (q[$1]) print $3, $1;        # only report non-banned queries
        delete q[$1];
    }
' | sort -nr | head -n 3

Answer

grep먼저, 호출이 필요하지 않다는 점에 유의하세요. awk호출에 원활하게 통합됩니다.

<logfile awk '/endQuery/ {print $3 " " $1}'

awk 단계에서 금지된 쿼리를 필터링할 수 있습니다. 진행 중인 쿼리를 배열에 저장하고, 금지된 경우 제거하고, 금지되지 않은 쿼리만 인쇄합니다.

<logfile awk '
    $2 == "startQuery" {q[$1]=1}        # store the names of active queries
    q[$1] && /banned/ {delete q[$1]}    # delete banned queries
    $2 == "endQuery" {
        if (q[$1]) print $3, $1;        # only report non-banned queries
        delete q[$1];
    }
' | sort -nr | head -n 3

Question 2

나는 다음을 공식화했습니다.

diff <(grep "endQuery" logfile | awk '{print $1}') \
     <(grep "banned"   logfile | awk '{print $1}') | \
  grep "<" | awk '{print $2}' | xargs -I{0} grep "{0} endQuery" logfile | \
    awk '{print $3 " " $1}' | sort -nr | head -n3
1434 query3
1000 query2
100 query4

그러나 로그 파일에 대한 3개의 grep이 필요하므로 대용량 로그 파일의 경우 비용이 많이 들 수 있습니다.

Answer

나는 다음을 공식화했습니다.

diff <(grep "endQuery" logfile | awk '{print $1}') \
     <(grep "banned"   logfile | awk '{print $1}') | \
  grep "<" | awk '{print $2}' | xargs -I{0} grep "{0} endQuery" logfile | \
    awk '{print $3 " " $1}' | sort -nr | head -n3
1434 query3
1000 query2
100 query4

그러나 로그 파일에 대한 3개의 grep이 필요하므로 대용량 로그 파일의 경우 비용이 많이 들 수 있습니다.

비활성화된 줄을 포함하지 않는 로그 파일에서 쿼리 추출

답변1

답변2

관련 정보