백업용으로 뭔가를 쓰고 있어요. 매우 큰 파일/폴더(100만++, 100TB++)를 다루고 있습니다.
속도를 높이려면 트리에서 가장 큰 폴더 10개 이상을 선택해야 하며, 이를 위해서는 트리에 대해 알아야 합니다.
- 하위 트리에서 가장 큰 10~20개 폴더는 무엇입니까? (디스크 사용량)
- 대부분의 부분 파일이 포함된 폴더입니다. (사용량은 중요하지 않습니다. 4k 임의 속도)
du -kh
시간이 너무 오래 걸리기 때문에 정보를 얻을 수 없습니다 .
이제 저는 먼저 폴더 트리를 만든 다음 파일 없이 로컬 저장소에서 계산을 수행해야 한다고 생각하고 있습니다.
하지만! 이렇게 하면 폴더 트리를 알 수 있습니다. 어느 폴더에 가장 큰 파일과 가장 작은 파일이 있는지 아직도 모르겠습니다.
두 정보 모두 찾을 수 없으며 지금은 "추측 방법"의 옵션 2를 고려 중입니다.
어떻게 해야 합니까?
답변1
정보를 저장하고 제공하기 위해 특별한 파일 시스템을 사용하지 않는 한 폴링은 du
기본적으로 최선의 방법입니다.
ufs/ext와 같은 표준 파일 시스템은 폴더 내용의 전체 크기를 추적하지 않으므로 (비싼) 요청을 해야 합니다.
파일이 100만 개가 넘으면 즉시 작업을 수행할 수는 없지만 du
나중에 사용할 수 있도록 출력을 실행하고 보관할 수 있습니다.