1,000,000개의 작은 파일 복사 속도 향상

Question 1

우리가 말하면

반환된 항목은 readdirinode 번호별로 정렬되지 않습니다.
inode 순서로 파일을 읽으면 검색 작업 수가 줄어듭니다.
파일 내용의 대부분은 초기 8k 할당(ext4 최적화) 내에 있으므로 탐색 작업도 줄어듭니다.

inode 순서로 파일을 복사하여 복사 속도를 높일 수 있습니다.

이는 다음과 같은 것을 사용한다는 것을 의미합니다.

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Answer

우리가 말하면

반환된 항목은 readdirinode 번호별로 정렬되지 않습니다.
inode 순서로 파일을 읽으면 검색 작업 수가 줄어듭니다.
파일 내용의 대부분은 초기 8k 할당(ext4 최적화) 내에 있으므로 탐색 작업도 줄어듭니다.

inode 순서로 파일을 복사하여 복사 속도를 높일 수 있습니다.

이는 다음과 같은 것을 사용한다는 것을 의미합니다.

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Question 2

tar전통적으로 GNU는 pax하드 링크 자체를 처리합니다.

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

이렇게 하면 두 개의 프로세스만 있고 반복해서 호출 tar할 필요가 없습니다 .cp

Answer

tar전통적으로 GNU는 pax하드 링크 자체를 처리합니다.

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

이렇게 하면 두 개의 프로세스만 있고 반복해서 호출 tar할 필요가 없습니다 .cp

Question 3

비슷하게작성자: @maxschlepzig대답은 출력을 구문 분석하여 filefrag첫 번째 조각이 디스크에 나타나는 순서대로 파일을 정렬할 수 있다는 것입니다.

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMV에는 위의 스크립트가 포함되어 있으므로 sed철저하게 테스트해 보시기 바랍니다.

그렇지 않으면 무엇을 하든 (의 일부)는 여러 파일 인수를 사용할 수 있는 것보다 훨씬 빠르게 filefrag사용됩니다 . 1,000,000번 실행하는 오버헤드만으로도 많은 오버헤드가 추가됩니다.e2fsprogshdparmhdparm

perl또한 FIEMAP ioctl각 파일에 대해 복사해야 할 청크와 해당 청크가 속한 파일의 정렬된 배열을 생성한 다음 모든 것을 순서대로 복사하고 각 청크를 읽는 스크립트(또는 C 프로그램)를 작성하는 것은 그리 어렵지 않을 수 있습니다. 해당 파일 크기(단, 파일 설명자가 부족하지 않도록 주의하세요)

Answer

비슷하게작성자: @maxschlepzig대답은 출력을 구문 분석하여 filefrag첫 번째 조각이 디스크에 나타나는 순서대로 파일을 정렬할 수 있다는 것입니다.

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMV에는 위의 스크립트가 포함되어 있으므로 sed철저하게 테스트해 보시기 바랍니다.

그렇지 않으면 무엇을 하든 (의 일부)는 여러 파일 인수를 사용할 수 있는 것보다 훨씬 빠르게 filefrag사용됩니다 . 1,000,000번 실행하는 오버헤드만으로도 많은 오버헤드가 추가됩니다.e2fsprogshdparmhdparm

perl또한 FIEMAP ioctl각 파일에 대해 복사해야 할 청크와 해당 청크가 속한 파일의 정렬된 배열을 생성한 다음 모든 것을 순서대로 복사하고 각 청크를 읽는 스크립트(또는 C 프로그램)를 작성하는 것은 그리 어렵지 않을 수 있습니다. 해당 파일 크기(단, 파일 설명자가 부족하지 않도록 주의하세요)

1,000,000개의 작은 파일 복사 속도 향상

답변1

답변2

답변3

관련 정보