실패한 XFS 파일 시스템을 감지하는 방법은 무엇입니까?

Question 1

음. 무엇을 해야할지나실패한 XFS 파일 시스템이 감지되었습니까?

저는 수년 동안 XFS를 사용해 왔습니다. 하지만 나는 생각해나전혀 감지하지 마십시오. 설치가 성공하면 제대로 작동할 것이라고 믿습니다. 이것이 대부분의 사람들이 하는 일입니다. 파일 시스템 검사가 자동화되어 실행 중이면 그게 전부입니다.

오해하지 마세요. 나는 실제로 많은 모니터링을 수행하지만 그 중 파일 시스템에 특정한 모니터링은 없습니다. SMART 자체 테스트를 실행합니다( 시간이 너무 오래 걸리기 select,cont때문에 매일 디스크 세그먼트를 수행합니다 ). longRAID 검사(스테이징 단계에서도)를 실행하고 패리티 불일치( mismatch_cnt=0)를 검사합니다. 이들 중 하나라도 실패하면 즉시 이메일 알림을 받고 섹터 재할당이 시작되면 실제로 HDD를 교체하겠습니다(또는 적어도 더 이상 중요한 데이터를 신뢰하지 않습니다).

그래서 스토리지가 제대로 작동하는지 모니터링합니다. 여기에는 드라이브 자체(SMART) 내의 오류와 어느 정도 더 높은 수준의 오류가 포함됩니다(RAID 검사는 컨트롤러, 케이블, RAID 논리 등도 어느 정도 테스트합니다).

제대로 작동하는 한 파일 시스템도 이상적으로 작동해야 합니다. ZFS/btrfs(향후에는 XFS 가능)와 같은 체크섬 파일 시스템을 제외하고, 파일 시스템 자체에서 내부적으로 수행되는 온전성 검사 외에 마운트 시 파일 시스템 수준에서 검사를 실행하는 것은 실제로 불가능합니다. 개념.

출력에는 RAID를 실행 중이고 해당 RAID에 장애가 발생한 디스크가 있음이 나타납니다. md0중복성이 없는 RAID(RAID0 또는 성능이 저하된 RAID1/5/6/10)가 아닌 한 오류가 발생해서는 안 됩니다. .

먼저 파일 시스템 계층 아래의 문제를 해결해야 합니다. 디스크 오류에 대해 XFS를 비난할 수는 없지만 디스크 오류를 확인하는 방법도 아닙니다.

파일 시스템 위에서 전체 읽기 테스트를 실행하고 싶다면 xfsdump백업 디스크에 대해 수행할 수 있을 것 같습니다. 어쨌든 파일 시스템에서 전체 읽기 테스트를 수행하려는 경우 다음과 같이 할 수 있습니다. 글쎄요, 어떤 면에서는 의미가 있는 일이죠.

그 본질은 xfsdumpXFS 파일 시스템을 완전히 탐색하고 모든 파일을 저장하는 것입니다. 따라서 이는 여유 공간을 제외하고 가능한 한 완전한 읽기 테스트에 가까워야 합니다.

물론, 이미 다른 백업 시스템을 실행하고 있다면 실제로는 파일 시스템 독립적인 방식으로 동일한 상황입니다. (해당 백업 시스템에서 단순한 권한 부족 이상의 읽기 오류가 발생하는 경우 메일 보고서를 보내는 것이 가장 좋습니다. , 또한) 물론 증분 백업이라면 정기적인 전체 백업 없이는 실제로 파일을 여러 번 읽지는 않습니다...

그러나 일반적으로 스토리지가 작동한다는 것을 아는 한 파일 시스템이 "제대로 작동"할 것이라고 믿습니다. 모든 프로그램이 예외 없이 발생하는 모든 I/O 오류를 끌어올리면 좋겠지만 실제로 이를 수행하는 보편적인 솔루션은 없습니다. 각 프로그램에는 자체 오류 처리 기능이 있습니다.

Answer