SMART가 높은 Load_Cycle_Count를 표시하는 이유와 카운트 증가를 방지하는 방법은 무엇입니까?

SMART가 높은 Load_Cycle_Count를 표시하는 이유와 카운트 증가를 방지하는 방법은 무엇입니까?

나는 곧 깨달았다내 하드 드라이브 중 일부에는 Load_Cycle_Count가 엄청납니다.SMART 데이터를 읽을 때. 어떤 사람들은 빨리 실패하는데, 나는 그것이 왜 그런지, 그들이 죽는 것을 막기 위해 내가 할 수 있는 일이 있는지 자문합니다.

alex@ga-P55A-UD5:~$ sudo smartctl -a /dev/sdb
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-142-generic] (로컬 빌드)
저작권 (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== 정보 섹션 시작 ===
모델 시리즈: Western Digital Caviar Green(AF)
장비 모델: WDC WD10EARS-00Y5B1
[...]
임계값이 있는 공급업체별 SMART 속성:
ID# ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트되었습니다. WHEN_FAILED RAW_VALUE
  4 Start_Stop_Count 0x0032 090 090 000 Old_age 항상 - 10281
  9 Power_On_Hours 0x0032 062 062 000 Old_age 항상 - 28456
193 Load_Cycle_Count 0x0032 001 001 000 Old_age 항상 - 611460
alex@ga-P55A-UD5:~$ sudo smartctl -a /dev/sdc
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-142-generic] (로컬 빌드)
저작권 (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== 정보 섹션 시작 ===
모델 시리즈: Western Digital Caviar Green
장비 모델: WDC WD6400AADS-00M2B0
[...]
임계값이 있는 공급업체별 SMART 속성:
ID# ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트되었습니다. WHEN_FAILED RAW_VALUE
  4 Start_Stop_Count 0x0032 093 093 000 Old_age 항상 - 7615
  9 Power_On_Hours 0x0032 057 057 000 Old_age 항상 - 31743
193 Load_Cycle_Count 0x0032 053 053 000 Old_age 항상 - 442121
alex@silent-ssd:~$ sudo smartctl -a /dev/sdd
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-142-generic] (로컬 빌드)
저작권 (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== 정보 섹션 시작 ===
모델 시리즈: 웨스턴 디지털 그린
장비 모델: WDC WD20EARX-00PASB0
[...]
임계값이 있는 공급업체별 SMART 속성:
ID# ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트되었습니다. WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200 200 051 항상 사전 실패 - 0
  4 Start_Stop_Count 0x0032 098 098 000 Old_age 항상 - 2477
  9 Power_On_Hours 0x0032 085 085 000 Old_age 항상 - 11176
193 Load_Cycle_Count 0x0032 181 181 000 Old_age 항상 - 59646

답변1

지금까지 내가 찾은 것 :

이유

  • ~에 대한서부 디지털그리고 다양한 웹사이트1,2,,4,5,6 높은 숫자SMART 속성 193에서 Load_Cycle_Count그리고WesternDigital이 시작한 새로운 이니셔티브스마트 파크.
  • Intellipark는 일부 하드 드라이브 모델, 특히 그린 시리즈에서 구현됩니다.
  • 드라이브를 사용하지 않을 때 전력 소비를 줄이도록 설계되었습니다.
  • 특정 사용 사례, 특히 Linux 운영 체제와 결합된 경우 이 Intellipark 기능은 하드 드라이브의 수명을 단축시키는 경향이 있습니다.

해결책

  • 서부 디지털기능상의 버그가 아니라 운영 체제가 잘못 구성된 것이라고 설명하면서 몇 가지 정보를 제공했습니다.Linux를 올바르게 구성하는 방법에 대한 조언.
  • 웨스턴디지털도 출시DOS 도구일부 장치에서 Intellipark 기능을 수정합니다.
  • 게시자: Christophe Bothamy(Linux 플랫폼용)유휴 도구 3개Intellipark 기능 수정- 내 웹사이트에 많은 감사를 드립니다.
  • 아래 설명에서 언급했듯이 hdparm -Jwd IDLE3 타이머를 수정하지만 다른 설명에서는 다음과 같이 지적했습니다.이 구현은 공식 WDIDLE3.EXE만큼 철저하지 않습니다.

내가 뭘 한거지

이제 Intellipark를 다운로드 idle3ctl하고 완전히 닫았습니다. 이것이 디스크의 빠른 고장을 방지하는 데 도움이 되기를 바랍니다. 그러나 어쨌든 SMART에 관한 한 적어도 하나의 디스크가 거의 죽었습니다.

Intellipark 기능을 비활성화하려면 다음을 따르십시오.유휴 도구 3개지시하다.

먼저 이 Intellipark 함수의 Idle3 타이머 값을 읽었습니다.sudo ./idle3ctl -g /dev/sdx

내가 타이머를 비활성화하는 것보다 sudo ./idle3ctl -d /dev/sdx

적용하려면 전원 끄기/켜기 주기가 필요합니다. sudo hdparm -Y /dev/sdx

그 후 Idle3 시간을 다시 확인하고 다시 시작한 후에도 동일한 작업을 수행했습니다.

alex@silent-ssd:~/idle3tools/idle3-tools-0.9.1$ sudo ./idle3ctl -g /dev/sdd
Idle3 타이머가 비활성화되었습니다.

2023년 편집

저는 단지 4년 사용 후 드라이브 상태에 대한 업데이트를 제공하고 싶었습니다. 지금까지 모든 드라이브는 여전히 활성 상태이지만 로드 주기 수가 500,000을 초과하는 두 개의 디스크는 더 이상 사용되지 않거나 중요하지 않은 작업에만 가끔 사용됩니다. 세 번째 드라이브는 아직 사용 중입니다. BTC 블록체인을 보유하고 있으며 4년 동안 거의 연중무휴로 운영되고 있습니다. 로드 사이클 횟수는 단지 수천 개만 증가했습니다. 속도를 늦추기 위해 hd-idle과 3시간 타이머를 사용하지만 거의 끊임없이 업데이트되는 블록체인으로 인해 일반적으로 효과가 없습니다.

드라이브의 스마트 데이터는 다음과 같습니다.

=== 정보 섹션 시작 ===
모델 시리즈: 웨스턴 디지털 그린
장비 모델: WDC WD20EARX-00PASB0
[...]

SMART 속성 데이터 구조 개정 번호: 16
임계값이 있는 공급업체별 SMART 속성:
ID# ATTRIBUTE_NAME 플래그 값 최악의 임계값 유형이 업데이트되었습니다. WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200 200 051 항상 사전 실패 - 0
  4 Start_Stop_Count 0x0032 098 098 000 Old_age 항상 - 2713
  9 Power_On_Hours 0x0032 046 046 000 Old_age 항상 - 40109
 193 Load_Cycle_Count 0x0032 180 180 000 Old_age 항상 - 61955
HDD 수명에 대한 참고 사항:
이 기사(https://superuser.com/questions/197862/how-harmful-is-a-hard-disk-spin-cycle) 덕분에 좋은 논문/연구를 찾았습니다(https://www.usenix.org). ) /legacy/event/fast07/tech/full_papers/pinheiro/pinheiro_html/index.html ) 하드 드라이브 오류 및 SMART 값 해석 방법에 대한 결론을 알아보세요.

답변2

저는 600k 내구성 등급의 LCC인 1TB WD Blue Mobile WD10SPZX를 가지고 있습니다. 또한 매우 빠르게 성장합니다(시간당 약 7.7주기).

coutinho@discovery:~$ sudo smartctl -a /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD10SPZX-75Z10T1
[...]
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       119
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       3040
193 Load_Cycle_Count        0x0032   193   193   000    Old_age   Always       -       23541

WD 둘다 써봤는데WIDLE3DOS 도구 및유휴 도구 3개, 내 디스크에서는 작동하지 않습니다.

마지막으로 hdparm을 사용하여 APM 값을 254로 설정하고 /etc/hdparm.conf에 다음 줄을 추가하여 LCC 증가분을 시간당 1 미만으로 줄이는 데 성공했습니다.

/dev/sdb {
    apm           = 254
    spindown_time = 0
}

답변3

WD Green 디스크는 디스크가 유휴 상태가 된 후 비교적 빠르게 헤드를 파킹하도록 설계되었습니다. 따라서 더 높은 로드 카운트를 얻게 됩니다.

오래된 글인데 아직도 정확하네요.https://www.pugetsystems.com/labs/articles/Western-Digital-Green-vs-Red-Hard-Drives-602/쓰다

로드/언로드 주기는 디스크가 작동 준비를 위해 플래터를 회전하는 데 소비하는 시간입니다. 일반적으로 이는 시스템을 켤 때, 대기 모드에서 재개할 때 또는 운영 체제가 드라이브를 종료할 만큼 오랫동안 드라이브가 유휴 상태일 때 발생합니다. [..] 그린 드라이브가 평가하는 300,000사이클은 실제로 상당히 많은 것입니다. 시스템을 켜거나 끄거나 하루 20번, 1년 365일 드라이브 전원을 끌 만큼 오랫동안 유휴 상태로 두더라도 친환경 드라이브는 40년 이상 지속됩니다.

반품

코 정지 지연은 8초입니다.

귀하의 경우 두 개의 디스크는 각각 31743시간과 11176시간 동안 전원이 켜져 있었습니다(약 3년 6개월 및 1년 3개월, 24x7). 이 시간 동안의 언로드/로드 주기 수는 실제로 무리한 것이 아닙니다.

하루 24시간, 일주일 내내 달리고 있다면 그린 대신 WD 레드를 사용해야 한다는 점을 참고하세요.

답변4

토론에 추가: 저는 5개의 드라이브가 있고 WD Red 3TB 드라이브가 설치된 Synology NAS를 감독합니다.

  • Power_On_Hours = 49760, 드라이브 1, 2, 3, 5의 경우 +/- 2.
  • 드라이브 4의 Power_On_Hours = 26959는 어느 시점에서 오류가 발생한 드라이브를 교체했기 때문입니다.

교체품은 원래 구매한 8개 드라이브 중 하나였으며, 그 중 5개는 설치되었고 3개는 교체용으로 저장되었습니다. 따라서 한 배치에서 모든 드라이브를 가져오는 것을 피하기 위해 서로 다른 두 공급업체에서 구입하더라도 모든 드라이브는 동일한 시점에 있습니다.

  • Load_Cycle_Count = 드라이브 1,3, 5의 경우 345 +/-2
  • 드라이브 2 Load_Cycle_Count = 656
  • 드라이브 4(단 27,000시간만 운전) Load_Cycle_Count = 93144!!

아무튼 2번드라이브에 대한 오류 경고 메일 때문에 SMART 데이터를 보고 있는데,

  • 드라이브 2: Raw_Read_Error_Rate = 4520.
  • 드라이브 1,3,5 Raw_Read_Error_Rate = 0
  • 드라이브 4(또한 27khr 단위) Raw_Read_Error_Rate = 10232 !!

그래서 어떤 이유에서인지 다른 드라이브보다 늦게 설치된 드라이브의 Load_Cycle_Count와 Raw_Read_Error_Rate가 엄청났습니다.

이 모든 것을 어떻게 해야할지 모르겠습니다.

관련 정보