대규모 디렉토리에서 동시에 1000개의 파일을 효율적으로 결합하고 삭제합니다.

Question 1

루프가 필요하지 않으며 cat모든 파일을 읽도록 지시할 수 있습니다.

cat /var/abc/*.csv > file1.csv && rm /var/abc/*.csv

파일이 너무 많지 않은 한(그러나 한계는 엄청납니다).

&&파일이 성공적으로 "복사"된 경우에만 삭제되도록 하기 위해 두 명령 사이에 사용됩니다 .

그러나 몇 가지 주의 사항이 있습니다.

연결하려는 원본 파일과 동일한 폴더에서는 이 명령을 실행할 수 없습니다. 그렇지 않으면 rm집합이 삭제되고 모든 것을 잃게 됩니다.
cat의 시작과 매개변수 확장 사이에 새 CSV 파일이 나타나면 rm해당 파일은 삭제되고 복사되지 않습니다.
가입 후 CSV 파일이 수정되면 해당 수정 사항이 손실됩니다.

출력 파일을 생성하기 전에 파일 목록을 저장하면 처음 두 가지 주의 사항을 완화할 수 있습니다.

set -- /var/abc/*.csv
cat -- "$@" > file1.csv && rm -- "$@"

파일을 복사한 후에도 파일에 대한 변경 사항은 여전히 손실됩니다.

한 번에 1000개의 파일(1000개의 원본 CSV마다 하나의 CSV가 생성됨)과 원하는 수의 파일을 연결하려면 대상 디렉터리에서 다음 단계를 수행하면 됩니다.

find /var/abc -maxdepth 1 -type f -name \*.csv | split -d -l 1000 - csvlists
for file in csvlists*; do cat $(cat $file) > concat${file##csvlists}.csv && rm $(cat $file); done

/var/abc그러면 이름이 지정된 모든 파일을 찾고 *.csv( , ...)로 시작하는 파일에서 한 번에 1000개의 파일을 나열합니다. 그런 다음 각 파일 목록을 반복하고 나열된 CSV 파일을 이름이 등인 파일로 연결하여 목록과 일치시킵니다. 각 파일 세트가 복사된 후 원본 파일은 삭제됩니다.csvlistscsvlists00csvlists01forconcat00.csv

이 버전에서는 CSV 파일 이름에 공백, 줄 바꿈 등이 포함되어 있지 않다고 가정합니다.

Answer

루프가 필요하지 않으며 cat모든 파일을 읽도록 지시할 수 있습니다.

cat /var/abc/*.csv > file1.csv && rm /var/abc/*.csv