디스크 드라이브가 갑자기 재부팅되고 RAID에서 제거됨

디스크 드라이브가 갑자기 재부팅되고 RAID에서 제거됨

우리는 소프트웨어 RAID6을 사용하는 6개의 하드 드라이브를 갖춘 여러 대의 서버를 보유하고 있습니다. 최근에 서버 중 하나에서 성능 문제가 발생하기 시작했고 디스크 드라이브 중 하나가 RAID에서 제거된 것을 발견했습니다. mdadm으로 다시 추가했고 다시 동기화되었으며 모든 것이 정상으로 돌아왔지만 몇 시간마다 계속 발생합니다.

디스크가 RAID에서 제거되고 mdadm에 RAID 상태가 저하됨으로 표시됩니다. 장치 시작/중지 수는 1씩 증가합니다(smartctl에서). 또한 장치가 sdc에서 sdg로 또는 그 반대로 변경됩니다. 그래서 문제를 디버깅하는 방법이나 문제를 방지하는 방법을 잘 모르겠습니다. 이는 디스크에 결함이 있으므로 호스트에 교체를 요청해야 한다는 의미입니까? 아니면 소프트웨어 문제인가요?

관련 정보