GNU Parallel - m개의 정규식을 찾기 위해 n줄을 grep합니다.

Question

이는 GNU Parallel --pipe의 느린 속도 때문입니다.

cat bigfile |  parallel --pipe -L1000 --round-robin grep -f regexp.txt -

최대 속도는 약 100MB/s입니다.

매뉴얼 페이지 예에서는 다음도 찾을 수 있습니다.

parallel --pipepart --block 100M -a bigfile grep -f regexp.txt

성능은 거의 동일하지만 64코어 시스템에서 최대 20GB/s에 도달할 수 있습니다.

parallel --pipepart --block 100M -a bigfile -k grep -f regexp.txt

정확히 같은 결과를 주어야합니다grep -f regexp.txt bigfile

Answer 1

이는 GNU Parallel --pipe의 느린 속도 때문입니다.

cat bigfile |  parallel --pipe -L1000 --round-robin grep -f regexp.txt -

최대 속도는 약 100MB/s입니다.

매뉴얼 페이지 예에서는 다음도 찾을 수 있습니다.

parallel --pipepart --block 100M -a bigfile grep -f regexp.txt

성능은 거의 동일하지만 64코어 시스템에서 최대 20GB/s에 도달할 수 있습니다.

parallel --pipepart --block 100M -a bigfile -k grep -f regexp.txt

정확히 같은 결과를 주어야합니다grep -f regexp.txt bigfile

관련 정보