커널 메시지의 HDD IO 오류 + 확실히 HDD 오류인가요?

커널 메시지의 HDD IO 오류 + 확실히 HDD 오류인가요?

RHEL 서버(RHEL 버전 - 7.2)에는 다음과 같은 dmesg 줄이 많이 있습니다.

sdb 디스크(하드디스크)에 대한 예

[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): error count since last fsck: 1329
[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): initial error at time 1614482941: ext4_find_entry:1312: inode 67240512
[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): last error at time 1640670898: ext4_find_entry:1312: inode 67240512
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 Sense Key : Medium Error [current]
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 Add. Sense: Unrecovered read error
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 CDB: Read(10) 28 00 80 41 13 38 00 00 08 00
[Thu Dec 30 13:12:19 2021] blk_update_request: critical medium error, dev sdb, sector 2151748408



[Thu Dec 30 13:14:38 2021] EXT4-fs warning (device sdb): __ext4_read_dirblock:902: error reading directory block (ino 67240512, block 0)
[Thu Dec 30 13:17:05 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:21:26 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 Sense Key : Medium Error [current]
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 Add. Sense: Unrecovered read error
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 CDB: Read(10) 28 00 80 41 13 38 00 00 08 00
[Thu Dec 30 13:21:59 2021] blk_update_request: critical medium error, dev sdb, sector 2151748408
[Thu Dec 30 13:21:59 2021] EXT4-fs warning (device sdb): __ext4_read_dirblock:902: error reading directory block (ino 67240512, block 0)
[Thu Dec 30 13:25:32 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:27:19 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:29:14 2021] NOHZ: local_softirq_pending 08

질문은 위의 메시지를 기반으로 합니다.

응? 가장 가능성이 높은 원인은 노후로 인해 하드 드라이브가 죽어가는 것입니까?

그렇다면 어떻게 해야 합니까? 디스크를 교체합니까?

인용하다 -https://access.redhat.com/solutions/35465

답변1

"노후화"는 드라이브가 더 이상 사용되지 않으며 로그 정보에서 확인할 수 없음을 의미합니다.

하지만 이것이 전문적인 환경에 있다고 가정합니다. 그렇다면 디스크 미디어 오류가 발생하면 디스크 교체가 발생해야 한다고 생각합니다. "중요한 미디어 오류" 메시지는 이를 나타냅니다.디스크와 시스템 간의 장애와 관련이 없는 디스크 오류(예를 들어케이블 고장). 질문의 로그에는 실패한 섹터가 하나만 표시되므로 로컬 오류일 가능성이 높지만 데이터 저장소에 의존하는 경우 위험을 감수할 가치가 없습니다.

실패한 섹터가 하나(또는 몇 개)만 있는 경우 다시 매핑하여 드라이브를 계속 사용할 수 있습니다(일시적으로).smartctl은 불량 섹터를 다시 테스트합니다.예를 들어.

관련 정보