game_data.csv
백만 줄이 넘는 파일(70MB 크기)이 있습니다 . 저는 CSV에서 일부 처리를 수행하고 CSV 데이터를 데이터베이스에 쓰는 애플리케이션을 작성 중입니다.
애플리케이션을 개발할 때 더 작은 CSV를 사용하고 싶습니다. CSV의 처음 1500개 행을 가져와서 별도의 CSV 파일에 넣으려면 어떤 Linux 명령을 실행할 수 있습니까 subset_game_data.csv
?
저는 Manjaro Linux를 사용하고 있습니다(사용 가능한 경우).
답변1
데이터에 개행 문자가 포함되어 있지 않으면 를 사용하여 쉽게 수행할 수 있습니다 head -n 1500 game_data.csv > subset_game_data.csv
.
데이터라면하다개행 문자가 포함되어 있으면 올바르게 구문 분석해야 합니다. Libreoffice Calc 또는 Python 스크립트와 같은 도구를 사용하세요.csvkit이 문제는 다음과 같은 방법을 사용하여 해결할 수 있습니다.
csvsql --query "select * from data limit 1500" game_data.csv > subset_game_data.csv