기가바이트 크기의 파일을 통해 작업할 때 과도한 메모리 사용으로 인해 grep이 충돌합니다.

Question

먼저, 가상 행은 cleaned1의 전체 행과 일치해야 하며 cleanedR, 이를 사용하면 이점을 얻을 수 있습니다 grep -x.

동일한 가정으로, cleaned1두 개의 큰 파일 및 을 정렬 할 수 있다면 which를 which 로 대체 cleanedR할 수 있으며 상당히 빠를 것입니다.grepcomm -1 -3 cleaned1 cleanedR

그렇지 않으면 분할 cleaned1(예 split -l 100000: )하여 청크로 수행할 수 있습니다. 이러한 grep(예: greps grep -Fvxf chunk1 cleanedR | grep -Fvxf chunk2 | ... > cleaned2)을 연결하여 여러 CPU에서 병렬화 할 수도 있습니다 .

Answer 1

먼저, 가상 행은 cleaned1의 전체 행과 일치해야 하며 cleanedR, 이를 사용하면 이점을 얻을 수 있습니다 grep -x.

동일한 가정으로, cleaned1두 개의 큰 파일 및 을 정렬 할 수 있다면 which를 which 로 대체 cleanedR할 수 있으며 상당히 빠를 것입니다.grepcomm -1 -3 cleaned1 cleanedR

그렇지 않으면 분할 cleaned1(예 split -l 100000: )하여 청크로 수행할 수 있습니다. 이러한 grep(예: greps grep -Fvxf chunk1 cleanedR | grep -Fvxf chunk2 | ... > cleaned2)을 연결하여 여러 CPU에서 병렬화 할 수도 있습니다 .

기가바이트 크기의 파일을 통해 작업할 때 과도한 메모리 사용으로 인해 grep이 충돌합니다.

답변1

관련 정보