액세스 로그를 청크로 효율적으로 정렬하는 방법

Question 1

tail -f access_log | awk -v 'cmd=sort --OPTION-IN-QUESTION | uniq -c' '
    {print $4, $1 | cmd}
    NR % 1000 == 0 {close(cmd)}'

Answer

tail -f access_log | awk -v 'cmd=sort --OPTION-IN-QUESTION | uniq -c' '
    {print $4, $1 | cmd}
    NR % 1000 == 0 {close(cmd)}'

Question 2

노력하다 split --filter:

split --lines 1000 --filter 'sort ... | sed ... | uniq -c' access.log

이는 1000개 행의 청크로 분할되고 access.log지정된 필터를 통해 각 청크를 파이프합니다.

각 블록의 결과를 별도로 저장하려면 $FILE필터 명령에서 접두사(기본값)를 사용하고 지정할 수 있습니다 x.

split --lines 1000 --filter '... | uniq -c >$FILE' access.log myanalysis-

myanalysis-aa그러면 첫 번째 청크, 두 번째 청크 등을 처리 한 결과가 포함된 파일이 생성됩니다 .myanalysis-ab

이 --filter옵션은 splitGNU coreutils 8.13(2011년 9월 출시)에 도입되었습니다.

Answer

노력하다 split --filter:

split --lines 1000 --filter 'sort ... | sed ... | uniq -c' access.log

이는 1000개 행의 청크로 분할되고 access.log지정된 필터를 통해 각 청크를 파이프합니다.

각 블록의 결과를 별도로 저장하려면 $FILE필터 명령에서 접두사(기본값)를 사용하고 지정할 수 있습니다 x.

split --lines 1000 --filter '... | uniq -c >$FILE' access.log myanalysis-

myanalysis-aa그러면 첫 번째 청크, 두 번째 청크 등을 처리 한 결과가 포함된 파일이 생성됩니다 .myanalysis-ab

이 --filter옵션은 splitGNU coreutils 8.13(2011년 9월 출시)에 도입되었습니다.

Question 3

sort이는 만병통치약이 아니며 데이터가 도착하기 전에 다른 적절한 도구를 사용하여 데이터를 필터링해야 합니다 sort. tail일을 해야 합니다. 예를 들어, 마지막 100개 행을 정렬하려면 다음을 수행합니다.

tail -100 /var/log/foo.log | sort

Answer

sort이는 만병통치약이 아니며 데이터가 도착하기 전에 다른 적절한 도구를 사용하여 데이터를 필터링해야 합니다 sort. tail일을 해야 합니다. 예를 들어, 마지막 100개 행을 정렬하려면 다음을 수행합니다.

tail -100 /var/log/foo.log | sort

Question 4

파일의 일부만 정렬하려면 sed다음을 사용할 수 있습니다.

행 15000부터 25000까지 정렬:

sed -n '15000,25000p' | sort

정렬된 파일을 유지하려는 경우에도 이를 고려할 수 있습니다 split.

사람을 보기 위해 split.

Answer

파일의 일부만 정렬하려면 sed다음을 사용할 수 있습니다.

행 15000부터 25000까지 정렬:

sed -n '15000,25000p' | sort

정렬된 파일을 유지하려는 경우에도 이를 고려할 수 있습니다 split.

사람을 보기 위해 split.

관련 정보