.txt 파일 묶음에서 모든 중복 항목을 제거합니다.

Question

간단한

sort -u Documents/*.txt > result.txt

그것은 이루어져야합니다. sort메모리보다 큰 파일을 처리하는 방법을 이미 알고 있으므로 awk에서 표시되는 메모리 부족 오류가 발생해서는 안 됩니다. awk에 메모리가 부족하다는 사실이 조금 놀랐다는 점을 인정해야 합니다. 32비트 응용 프로그램으로 컴파일되었습니까?

일반적으로 sort이 방법을 사용하는 것보다 를 사용하는 것이 더 느릴 수 있습니다 awk '!seen[$1]++'. 파일을 그룹으로 처리하여 속도를 회복할 수 있습니다.

Answer 1

간단한

sort -u Documents/*.txt > result.txt

그것은 이루어져야합니다. sort메모리보다 큰 파일을 처리하는 방법을 이미 알고 있으므로 awk에서 표시되는 메모리 부족 오류가 발생해서는 안 됩니다. awk에 메모리가 부족하다는 사실이 조금 놀랐다는 점을 인정해야 합니다. 32비트 응용 프로그램으로 컴파일되었습니까?

일반적으로 sort이 방법을 사용하는 것보다 를 사용하는 것이 더 느릴 수 있습니다 awk '!seen[$1]++'. 파일을 그룹으로 처리하여 속도를 회복할 수 있습니다.

.txt 파일 묶음에서 모든 중복 항목을 제거합니다.

답변1

관련 정보