Linux fgrep 대용량 "MIXED_WORDS" 파일에서 "only_words_in_my_언어"를 추출하는 방법은 무엇입니까?

Question

오류 메시지에서 알 수 있듯이 메모리가 부족합니다. 시스템은 900KB 파일의 모든 단어와 일치하는 정규식을 작성하고 있습니다. mix_word 파일의 크기는 중요하지 않습니다. 이 오류 메시지의 실제 의미는 오해의 소지가 있을 수 있습니다 regular expression too complicated.

lang.dict.txt를 더 작은 덩어리로 나눌 수 있어야 합니다. split이를 수행하려면 Unix 명령을 사용할 수 있습니다 .

Answer 1

오류 메시지에서 알 수 있듯이 메모리가 부족합니다. 시스템은 900KB 파일의 모든 단어와 일치하는 정규식을 작성하고 있습니다. mix_word 파일의 크기는 중요하지 않습니다. 이 오류 메시지의 실제 의미는 오해의 소지가 있을 수 있습니다 regular expression too complicated.

lang.dict.txt를 더 작은 덩어리로 나눌 수 있어야 합니다. split이를 수행하려면 Unix 명령을 사용할 수 있습니다 .

Linux fgrep 대용량 "MIXED_WORDS" 파일에서 "only_words_in_my_언어"를 추출하는 방법은 무엇입니까?

내 lang.dict.txt(900kb) 및 Mixed_file(64MB), grep에 따르면 메모리가 소진되었습니다.

답변1

관련 정보