장치에 충분한 공간이 있을 때 mv 중에 간헐적으로 발생하는 "장치에 남은 공간 없음" 오류를 수정하는 방법은 무엇입니까?

Question 1

dir_index대상 파일 시스템에서 사용 중인 ext4 기능 구현에 버그가 있습니다.

해결책: dir_index 없이 파일 시스템을 다시 생성하십시오. 또는 tune2fs를 사용하여 기능을 비활성화합니다(몇 가지 주의 사항이 필요합니다. 관련 링크 참조)Novell SuSE 10/11: ext3 파일 시스템에서 H-트리 인덱싱 비활성화여기에는외부 3비슷한 주의가 필요할 수도 있습니다.

(get a really good backup made of the filesystem)
(unmount the filesystem)
tune2fs -O ^dir_index /dev/foo
e2fsck -fDvy /dev/foo
(mount the filesystem)

ext4: 신비한 "장치에 남은 공간이 없습니다" 오류

ext4에는 해시 충돌에 취약한 dir_index라는 기능이 기본적으로 활성화되어 있습니다.

...

ext4는 내용의 파일 이름을 해시할 수 있습니다. 이렇게 하면 성능이 향상되지만 "작은" 문제가 있습니다. ext4가 가득 차기 시작하면 해당 해시 테이블이 커지지 않습니다. 대신 -ENOSPC 또는 "장치에 남은 공간이 없습니다"를 반환합니다.

Answer

dir_index대상 파일 시스템에서 사용 중인 ext4 기능 구현에 버그가 있습니다.

해결책: dir_index 없이 파일 시스템을 다시 생성하십시오. 또는 tune2fs를 사용하여 기능을 비활성화합니다(몇 가지 주의 사항이 필요합니다. 관련 링크 참조)Novell SuSE 10/11: ext3 파일 시스템에서 H-트리 인덱싱 비활성화여기에는외부 3비슷한 주의가 필요할 수도 있습니다.

(get a really good backup made of the filesystem)
(unmount the filesystem)
tune2fs -O ^dir_index /dev/foo
e2fsck -fDvy /dev/foo
(mount the filesystem)

ext4: 신비한 "장치에 남은 공간이 없습니다" 오류

ext4에는 해시 충돌에 취약한 dir_index라는 기능이 기본적으로 활성화되어 있습니다.

...

ext4는 내용의 파일 이름을 해시할 수 있습니다. 이렇게 하면 성능이 향상되지만 "작은" 문제가 있습니다. ext4가 가득 차기 시작하면 해당 해시 테이블이 커지지 않습니다. 대신 -ENOSPC 또는 "장치에 남은 공간이 없습니다"를 반환합니다.

Question 2

많은 수의 작은 파일을 저장하기 위한 ext4보다 더 나은 옵션에 대한 제안:

파일 시스템을 객체 스토리지로 사용하는 경우 이에 특화된 파일 시스템을 사용하는 것이 좋습니다. 이로 인해 다른 기능이 손상될 수 있습니다. 빠른 Google 검색 공개세팔로스포린는 오픈 소스로 보이며 POSIX 파일 시스템으로 설치될 수 있고 다른 API를 통해서도 액세스할 수 있습니다. 복제를 활용하지 않고 단일 호스트에서 그만한 가치가 있는지 모르겠습니다.

또 다른 객체 스토리지 시스템은오픈스택 스위프트. 디자인 문서에 그렇게 적혀 있어요xattrs에 메타데이터가 포함된 별도의 파일로 각 객체를 저장합니다.. 이것은그것에 관한 기사. 그들의배포 가이드그들은 XFS가 객체 스토리지에 최고의 성능을 제공한다는 사실을 발견했다고 밝혔습니다. 따라서 작업 부하가 XFS가 가장 잘하는 것은 아니지만 RackSpace에서 테스트했을 때 경쟁 제품보다 확실히 더 나았습니다. Swift는 확장된 속성에 대한 훌륭하고 빠른 지원으로 인해 XFS를 선호할 수 있습니다. 추가 메타데이터가 필요하지 않은 경우(또는 바이너리 파일에 보관된 경우) ext3/ext4는 단일 디스크의 객체 스토리지 백엔드로 잘 작동할 수 있습니다.

Swift는 복제/로드 밸런싱을 수행하고 원본 디스크에 생성된 파일 시스템을 제공할 것을 권장합니다.RAID가 아님. 워크로드는 본질적으로 RAID5의 최악의 경우라고 명시되어 있습니다(소규모 파일 쓰기가 포함된 워크로드에 대해 이야기하는 경우 의미가 있음). XFS는 일반적으로 처음부터 끝까지 이를 완전히 압축하지 않으므로 얻을 필요가 없습니다. 전체 스트라이프 쓰기 및 RAID5는 패리티 스트라이프를 업데이트하기 위해 일부 읽기를 수행해야 합니다. 또한 Swift 문서에서는 드라이브당 100개의 파티션을 사용하는 것에 대해 설명합니다. 이는 Swift 용어이며 각 드라이브에서 논의되지 않은 것 같습니다.

각 디스크에 대해 별도의 XFS를 실행하면 실제로 큰 차이가 발생합니다..거대한무료 inode 매핑의 경우 각 디스크에는 별도의 XFS와 별도의 사용 가능 목록이 있습니다. 또한 소규모 쓰기 시 RAID5 손실을 방지합니다.

Swift와 같은 것을 통해 복제/로드 밸런싱을 처리하는 대신 파일 시스템을 객체 스토리지로 직접 사용하는 소프트웨어를 구축했다면 적어도 모든 파일을 하나의 디렉터리에 두는 것을 피할 수 있습니다. (파일을 여러 디렉터리에 배치하는 방법을 설명하는 Swift 문서는 보이지 않지만, 그럴 것이라고 확신합니다.)

거의 모든 일반 파일 시스템의 경우 유사한 구조를 사용하면 도움이 됩니다.

1234/5678   # nested medium-size directories instead of
./12345678   # one giant directory

약 10,000개의 항목이 적절할 수 있으므로 균등한 간격의 4자 개체 이름을 가져와 이를 디렉터리로 사용하는 것이 간단한 해결책입니다. 완벽하게 균형을 이룰 필요는 없습니다. 이상한 100,000개 디렉토리는 아마도 명백한 문제가 아닐 것이며 일부 빈 디렉토리도 문제가 되지 않을 것입니다.

XFS많은 수의 작은 파일에는 적합하지 않습니다. 할 수 있는 작업을 수행하지만 더 큰 파일의 스트리밍 쓰기에 더 최적화되어 있습니다. 그래도 일반적으로 사용하기에는 꽤 괜찮습니다. ENOSPC해당 디렉토리 색인은 (내가 아는 한) 충돌이 없으며 수백만 개의 항목이 있는 디렉토리를 처리할 수 있습니다. (그러나 적어도 하나의 트리 레이어를 사용하는 것이 좋습니다.)

데이브 치너대규모 inode 할당 시 XFS 성능에 대한 일부 의견결과적으로 성능이 저하됩니다 touch. 할당할 여유 inode를 찾는 데는 여유 inode 비트맵이 조각화되기 때문에 CPU 시간이 더 많이 걸리기 시작합니다. 이는 하나의 큰 디렉터리와 여러 디렉터리의 문제가 아니라 전체 파일 시스템에서 사용되는 많은 inode의 문제입니다. 파일을 여러 디렉터리로 분할하면 OP의 ext4 차단 문제와 같은 일부 문제를 해결하는 데 도움이 되지만 여유 공간을 추적하는 전체 디스크 문제는 해결되지 않습니다. Swift의 디스크당 별도 파일 시스템은 RAID5의 거대한 XFS와 비교하여 이 문제를 해결하는 데 도움이 됩니다.

나는 모른다BTFS꽤 잘하는데 그럴 수도 있을 것 같아요. 페이스북이 수석 개발자를 고용하는 데에는 이유가 있다고 생각합니다. :P Linux 커널 소스 코드 압축 풀기 등 제가 본 일부 벤치마크에서는 btrfs가 잘 작동하는 것으로 나타났습니다.

알아요레이셀프스이 상황에 맞게 최적화되었지만 더 이상 유지 관리되는 경우가 거의 없습니다. 나는 reiser4를 사용하는 것을 정말로 권장하지 않습니다. 그래도 시도해 보는 것은 재미있을 것입니다. 그러나 이는 미래에 대한 보장이 가장 적은 옵션입니다. 또한 노후화된 reiserFS로 인해 성능이 저하되고 좋은 조각 모음 도구가 없다는 보고도 본 적이 있습니다. (Google에서 filesystem millions of small files기존 stackexchange 답변을 확인하세요.)

제가 놓친 부분이 있을 수도 있으니최종 제안: serverfault에 대해 이 질문을 해보세요! 지금 당장 무엇인가를 선택해야 한다면 BTRFS를 시도해 보되 백업이 있는지 확인하십시오. (특히 RAID 위에서 실행하는 대신 BTRFS의 내장 다중 디스크 중복성을 사용하는 경우 성능 이점이 클 수 있습니다. 읽기 중심의 기본 워크로드가 아닌 이상 작은 파일은 RAID5에 나쁜 소식이기 때문입니다.)

Answer