Linux 터미널에서 긴 크기의 CSV 파일에서 데이터를 분리하는 방법은 무엇입니까?

Question

grep이미 대용량 파일을 탐색하고 줄에서 단어나 문자를 찾는 매우 빠른 방법이지만 단어 -w정규식을 사용하면 약간 느려질 수도 있습니다. 느린 것은 프로그램 자체가 아니라 grep터미널의 출력 때문인 경우가 많습니다. 출력을 파일로 지정하여 간단하게 테스트할 수 있습니다.

grep -w "for-outbound-sports\|2019-05-16" Master.csv > greped_master.csv

언제든지 이 프로그램을 사용하여 parallel대용량 파일을 분할하고 멀티스레딩을 활용할 수 있습니다. parallel --pipe --block 2M grep foo < bigfile 보시 다시피 여기

Answer 1

grep이미 대용량 파일을 탐색하고 줄에서 단어나 문자를 찾는 매우 빠른 방법이지만 단어 -w정규식을 사용하면 약간 느려질 수도 있습니다. 느린 것은 프로그램 자체가 아니라 grep터미널의 출력 때문인 경우가 많습니다. 출력을 파일로 지정하여 간단하게 테스트할 수 있습니다.

grep -w "for-outbound-sports\|2019-05-16" Master.csv > greped_master.csv

언제든지 이 프로그램을 사용하여 parallel대용량 파일을 분할하고 멀티스레딩을 활용할 수 있습니다. parallel --pipe --block 2M grep foo < bigfile 보시 다시피 여기

Linux 터미널에서 긴 크기의 CSV 파일에서 데이터를 분리하는 방법은 무엇입니까?

답변1

관련 정보