하드 드라이브 오류

하드 드라이브 오류

/home파일 시스템은 JFS이고 RO 모드로 여러 번 전환되었으므로 재부팅/다시 마운트해야 합니다. "/var/log/messages"에 다음이 표시됩니다.

12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925711] ata2.00: UDMA/133용으로 구성됨
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925755] sd 1:0:0:0: [sda] 처리되지 않은 감지 코드
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925759] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925763] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925770] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925778] 0e 5a b2 b8
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925782] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925785] sd 1:0:0:0: [sda] CDB:
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925815] sd 1:0:0:0: [sda] 처리되지 않은 감지 코드
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925817] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925820] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925825] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925833] 00 00 00 00
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925836] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925839] sd 1:0:0:0: [sda] CDB:
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925863] sd 1:0:0:0: [sda] 처리되지 않은 감지 코드
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925865] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925868] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925872] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925879] 00 00 00 00
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925882] sd 1:0:0:0: [sda]  
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925885] sd 1:0:0:0: [sda] CDB:
12월 31일 10:12:49 uvv-laptop-y570 커널: [983.925908] ata2: EH 완료

그리고 smartctl -a /dev/sda나에게 이것을 주었다:

SMART 속성 데이터 구조 개정 번호: 16
공급업체별 SMART 속성 및 임계값:
ID# ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트되었습니다. WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200 200 051 항상 사전 실패 - 0
  3 Spin_Up_Time 0x0027 179 174 021 항상 실패하기 전 - 2008
  4 Start_Stop_Count 0x0032 099 099 000 Old_age 항상 - 1005
  5 Reallocation_Sector_Ct 0x0033 200 200 140 항상 - 실패 전 0
  7 Seek_Error_Rate 0x002e 200 200 000 Old_age 항상 - 0
  9 Power_On_Hours 0x0032 082 082 000 Old_age 항상 - 13675
 10 Spin_Retry_Count 0x0032 100 100 000 Old_age 항상 - 0
 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age 항상 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 항상 - 998
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age 항상 - 37
193 Load_Cycle_Count 0x0032 001 001 000 Old_age 항상 - 810861
194Temperature_Celsius 0x0022 106 091 000 Old_age 항상 - 41
196 Realowned_Event_Count 0x0032 200 200 000 Old_age 항상 - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age 항상 - 1
198 Offline_Un 수정 가능 0x0030 100 253 000 Old_age 오프라인 - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age 항상 - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age 오프라인 - 0

하드 드라이브 모델:

모델 시리즈: Western Digital Scorpio Blue Serial ATA(고급 형식)
장비 모델: WDC WD7500BPVT-24HXZT3
일련 번호: WD-WX91A91R4010
LU WWN 장치 ID: 5 0014ee 601b831c9
펌웨어 버전: 03.01A03

업데이트: 또 다른 자체 테스트(몇 달 전에 처음 수행한 테스트)를 시작했고 몇 가지 업데이트를 받았습니다.

SMART 자체 테스트 로그 구조 개정 번호 1
Num Test_Description 상태 남은 수명(시간) LBA_of_first_error
# 1 확장이 오프라인으로 완료됨: 읽기 실패 90% 13680 229857912
#2 오프라인 시간 연장이 오류 없이 완료되었습니다 00% 9661 -
# 3 확장이 오프라인으로 완료됨: 읽기 실패 90% 9654 96004576
# 4 확장이 오프라인으로 완료됨: 읽기 실패 90% 9653 96004576

이전에 #2부터 #4까지의 행이 이미 있었습니다. 나는 다음 지침을 따랐습니다.불량 블록 가이드그리고디버그 파일 시스템. 해당 블록은 더 이상 오류로 보고되지 않는 것으로 보이지만 재배치된 블록에는 포함되지 않고 증가되지 않습니다. 불량 블록에 0을 쓴 후에 증가하는 유일한 것은 Raw_Read_Error_Rate입니다.

문제는 새 하드 드라이브 주문을 고려해야 합니까?입니다.

답변1

smartctl매뉴얼 페이지 에서 :

인쇄된 속성 테이블지능형 제어또한 속성의 "유형"을 표시합니다. 속성은 사전 오류 또는 노화의 두 가지 가능한 유형 중 하나입니다. 사전 실패 속성은 임계값보다 작거나 같은 경우 보류 중인 디스크 실패를 나타내는 속성입니다. 노화 또는 사용량 속성은 속성 값이 임계값보다 작거나 같은 경우 노화 또는 정상적인 노화 및 마모로 인해 제품 수명이 끝났음을 나타내는 속성입니다. 참고하세요:속성이 "사전 실패" 유형이라는 사실이 디스크가 곧 실패할 것이라는 의미는 아닙니다. 이는 속성의 현재 정규화된 값이 임계값보다 작거나 같은 경우에만 이 의미를 갖습니다.

속성의 현재 정규화된 값이 임계값보다 작거나 같으면 "WHEN_FAILED" 열에 "FAILING_NOW"가 표시됩니다. 그렇지 않지만 최악의 기록 값이 임계값보다 작거나 같은 경우 열에 "In_the_past"가 표시됩니다. "WHEN_FAILED" 열에 항목이 없으면(대시로 표시: "-") 속성은 이제 OK(실패하지 않음)이며 과거에 실패한 적이 없습니다.

smartctl따라서 귀하가 게시한 출력 부분 에 따르면 귀하의 드라이브는 실제로 양호한 상태인 것처럼 보입니다. 그러나 이것이 반드시 다른 문제가 존재하지 않는다는 것을 의미하지는 않습니다.

불행하게도 이 Unhandled sense code메시지는 뭔가 잘못되었다는 뜻이지만 커널은 무엇이 잘못되었는지 알 수 없습니다. 나머지 smartctl출력을 살펴보고 문제가 있는지 확인할 수 있습니다. 드라이브의 전반적인 상태를 요약하는 섹션이 있어야 합니다. 이 옵션을 통해 별도로 받으실 수 있습니다 -H.

드라이브가 자체 테스트를 지원하는 경우 다음을 통해 자체 테스트를 시작할 수 있습니다.

smartctl -t long /dev/sda

이는 백그라운드에서 시작되므로 결과를 계속 확인해야 합니다. 드라이브가 마운트되지 않은 경우 -C강제 모드를 활성화하는 옵션을 추가하면 시간이 덜 걸립니다. short테스트도 가능하지만 덜 철저합니다.

물리적 커넥터 등을 점검하여 느슨한 것이 없는지 확인하는 것도 좋은 생각입니다. 그렇다면 쉽게 고칠 수 있습니다.

고쳐 쓰다

Wikipedia에 좋은 참고 자료가 있습니다.스마트 속성. "더 나은" 열은 처음의 정규화된 값이 아니라 출력의 가장 오른쪽 열에 있는 원래 값을 나타냅니다. "현재 보류 부서"를 언급하는 부분입니다.프로스트슈츠:

"불안정한" 섹터 수(복구할 수 없는 읽기 오류로 인해 다시 매핑을 기다리는 중) 이후에 불안정한 섹터를 성공적으로 읽으면 해당 섹터가 다시 매핑되고 이 값이 감소됩니다. 섹터의 읽기 오류는 섹터를 즉시 다시 매핑하지 않습니다(올바른 값을 읽을 수 없으므로 다시 매핑할 값을 알 수 없고 나중에 값을 읽을 수 없기 때문에 대신 드라이브 펌웨어가 섹터를 기억함). 다음 쓰기 시 다시 매핑하고 다시 매핑해야 합니다. 그러나 일부 드라이브는 쓰기 시 해당 섹터를 즉시 다시 매핑하지 않으며, 대신 드라이브는 먼저 문제 섹터에 쓰기를 시도하고 쓰기 작업이 성공하면 해당 섹터가 양호한 것으로 표시됩니다(이 경우 "재할당" 이벤트 카운트'(0xC4)는 증가하지 않습니다). 이는 심각한 단점입니다. 왜냐하면 그러한 드라이브에 쓰기 작업이 성공한 후 일정 시간이 지난 후에만 계속 실패하는 엣지 섹터가 포함되어 있는 경우 드라이브는 이러한 문제 섹터를 다시 매핑하지 않기 때문입니다.

답변2

드라이브에 현재 보류 중인 섹터가 1개 있습니다. 이는 해당 섹터를 올바르게 읽을 수 없음을 의미합니다. 일반적으로 이는 하드웨어 문제이며 SMART 자체 테스트 중에 읽기 오류가 발생합니다. 이 섹터에 쓰면 문제가 "해결"되거나 재할당된 섹터가 될 수 있습니다.

이 시점에서 드라이브의 데이터가 기술적으로 손실되었으므로 더 이상 중요한 일을 맡길 수 없습니다.

관련 정보