Linux md-RAID는 디스크 읽기 오류를 어떻게 처리합니까?

Question 1

md(4) 이에 대한 자세한 내용은 매뉴얼 페이지 섹션에 설명되어 있습니다 RECOVERY.

[...] 읽기 오류로 인해 md는 불량 블록을 덮어써서 복구를 시도하게 됩니다. 즉, 다른 곳에서 올바른 데이터를 찾아서 실패한 블록에 쓴 다음 다시 읽으려고 시도합니다. 쓰기 또는 다시 읽기가 실패하면 md는 쓰기 오류와 동일한 방식으로 오류를 처리하고 전체 장치에 실패합니다.

시간 초과의 경우 드라이브가 대기 모드에서 쫓겨난다는 보고가 있었지만 실제로 그런 일이 발생한 적은 없습니다. 나는 7개의 HDD를 가지고 있는데 일반적으로 정지되고(메인 시스템은 SSD로 실행되고 장기간 HDD 액세스 없이 실행될 수 있기 때문에) 잘 작동합니다( md모든 드라이브를 깨우는 대신 드라이브를 하나씩 깨우는 것을 제외하고). 한 번).

나는 그것이 다른 레이어가 보고하는 것에 달려 있다고 생각합니다 md.

Answer

md(4) 이에 대한 자세한 내용은 매뉴얼 페이지 섹션에 설명되어 있습니다 RECOVERY.

[...] 읽기 오류로 인해 md는 불량 블록을 덮어써서 복구를 시도하게 됩니다. 즉, 다른 곳에서 올바른 데이터를 찾아서 실패한 블록에 쓴 다음 다시 읽으려고 시도합니다. 쓰기 또는 다시 읽기가 실패하면 md는 쓰기 오류와 동일한 방식으로 오류를 처리하고 전체 장치에 실패합니다.

시간 초과의 경우 드라이브가 대기 모드에서 쫓겨난다는 보고가 있었지만 실제로 그런 일이 발생한 적은 없습니다. 나는 7개의 HDD를 가지고 있는데 일반적으로 정지되고(메인 시스템은 SSD로 실행되고 장기간 HDD 액세스 없이 실행될 수 있기 때문에) 잘 작동합니다( md모든 드라이브를 깨우는 대신 드라이브를 하나씩 깨우는 것을 제외하고). 한 번).

나는 그것이 다른 레이어가 보고하는 것에 달려 있다고 생각합니다 md.

Question 2

TLER가 위험한지에 대해서는 그렇지 않다고 생각합니다. 사실 이 기능이 필요했다는 사실이 아직도 믿기지 않습니다. 어떤 드라이브도 재시도하는 데 그렇게 오랜 시간이 걸리지는 않을 것입니다. 느린 5400rpm 드라이브가 수백 번 재시도하는 데는 7초면 충분합니다. 몇 번(수백 번은 고사하고) 시도 후에도 할 수 없다면 결코 할 수 없습니다.

Answer

TLER가 위험한지에 대해서는 그렇지 않다고 생각합니다. 사실 이 기능이 필요했다는 사실이 아직도 믿기지 않습니다. 어떤 드라이브도 재시도하는 데 그렇게 오랜 시간이 걸리지는 않을 것입니다. 느린 5400rpm 드라이브가 수백 번 재시도하는 데는 7초면 충분합니다. 몇 번(수백 번은 고사하고) 시도 후에도 할 수 없다면 결코 할 수 없습니다.

Linux md-RAID는 디스크 읽기 오류를 어떻게 처리합니까?

커널 시간 초과

드라이브에서 오류를 보고함

답변1

답변2

관련 정보