ext4: 불량 블록이 수정되었지만 이 디스크가 죽어가고 있습니까?

ext4: 불량 블록이 수정되었지만 이 디스크가 죽어가고 있습니까?

4TB WD Green SATA [WDC WD40EZRX-22SPEB0]의 Ubuntu 17.04;

슈퍼블록 손상으로 인해 마운트(부팅 시, fstab에서)가 실패했습니다. fsck에서 /inode가 손상되었다고 보고했지만 수정되었습니다. 99%의 파일이 복구되었습니다(손실된 소수의 파일은 백업에서 찾을 수 있음). 복구된 볼륨이 정상적으로 마운트되고 실행됩니다.

SMART 데이터를 보면디스크그것은 중요하지 않습니다. "확장된" smartctl 테스트가 통과되었습니다. 데이터가 백업됩니다(업무상 중요하지 않음). 이미 교체용 드라이브가 있습니다. 이제 "무관용" 정책을 채택하고 디스크를 교체하고 싶은 유혹이 들지만, 이 제품은 £100 품목이므로 불안정한 디스크를 버리고 기록된 모든 불량 블록과 함께 보관하고 싶지 않습니다.

이것은 smartctl 덤프입니다. 디스크가 정말 죽는 걸까요, 아니면 그냥 일회성 사고일까요?

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       61
  3 Spin_Up_Time            0x0027   195   176   021    Pre-fail  Always       -       7225
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       770
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       12325
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       730
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       40
193 Load_Cycle_Count        0x0032   194   194   000    Old_age   Always       -       18613
194 Temperature_Celsius     0x0022   121   106   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       21

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

답변1

SMART 판독값에 따르면 현재 디스크 상태는 양호한 것으로 보입니다.

흥미로운 디스크 섹터는 다음과 같습니다.

  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -    0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -    0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -    0

재할당된 섹터는 쓰기에 실패하여 디스크의 다른 위치에 다시 매핑된 섹터입니다. 이 중 소량은 허용됩니다. 제로는 훌륭합니다.

현재 보류 중인 섹터 값은 다른 곳에 재할당되기를 기다리는 섹터 수입니다. (읽기는 실패했지만 디스크는 섹터가 다시 매핑되는 시점인 쓰기 요청을 기다리고 있습니다.) 이는 잠시 동안 0이 아닌 상태가 될 수 있으며, 섹터를 덮어쓰게 되면 숫자가 감소하고 다시 매핑됩니다. -매핑됩니다. 할당된 섹터 수가 증가합니다.

수정할 수 없는 오프라인 섹터 수는 오류가 발생하여 다시 매핑할 수 없는 섹터 수입니다. 0이 아닌 값은 데이터가 손실된다는 의미이므로 나쁜 소식입니다. 0 값은 괜찮습니다.

다음 그룹은 디스크 드라이브 사용 기간을 보여줍니다.

  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -    770
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -    12325
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -    730

귀하의 장치는 12325시간(연속 시간인 경우 약 18개월) 동안 실행되었으며, 이 기간 동안 장치가 시작되고 종료된 횟수는 730회입니다. 매일 전원을 끄면 디스크는 2년 동안 하루에 약 16시간 동안 실행됩니다.

궁극적으로 매주 전체 테스트를 예약하는 것이 좋습니다. 와 같은 명령을 사용하여 이를 수행할 수 있습니다 smartctl -t full /dev/sda. 테스트 오류로 인해 우려가 발생할 수 있습니다.

# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

NAS에서 사용하신다면 NAS급 디스크를 추천드립니다. 개인적으로 WD Red가 이 점에서는 매우 좋다고 생각합니다. 비용은 약간 높지만 보증 기간은 더 깁니다.

관련 정보