다른 큰 텍스트 파일에서 발견된 문자열을 포함하는 큰 텍스트 파일의 줄 제거 - 파일 정렬

Question

$file1여러 개의 작은 파일(/tmp 또는 mktemp 사용)을 버스트한 다음 각 파일을 반복하고 $file1grep하는 것이 어떻습니까? 패턴 $file1파일()의 이상적인 크기는 시스템에 따라 다릅니다.

여기에서는 각 행 $file1에 1000개의 행이 있습니다.

i=1 while [ $i -lt $count ] do sed -n "$i,$(($i +1000))p" file1.txt >> /tmp/file${1}.txt i=$(( $i + 1001)) done

이제 /tmp에 file.txt라는 파일이 많이 있으므로 다음을 수행할 수 있습니다.

for file1 in $(ls /tmp/file*.txt) do grep -vwFf $file1 file2 done

mktemp를 사용하는 것이 더 안전합니다.

TEMP_DIR=$(mktemp)

for file1 in $(ls ${TEMP_DIR}/file*.txt) do grep -vwFf $file1 file2 done

Answer 1