이 드라이브가 죽었나요? : 삼성 SSD 970 EVO 플러스 1TB

이 드라이브가 죽었나요? : 삼성 SSD 970 EVO 플러스 1TB

중고 컴퓨터를 구입하여 여기에 smartd를 설치했습니다. smartd로부터 "중요 경고(0x04): 신뢰성" 이메일을 받았습니다(완료).페이스트빈). 이것은 Percentage Used: 112%걱정스럽습니다. smartd의 "심각한 경고(0x04): 신뢰성"이라는 설명으로 충분합니까?

This message was generated by the smartd daemon running on:

   host name:  kosh
   DNS domain: [Empty]

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, Critical Warning (0x04): Reliability

Device info:
Samsung SSD 970 EVO Plus 1TB, S/N:S4EWNM0R328374F, FW:2B2QEXM7, 1.00 TB

<snip>

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
- NVM subsystem reliability has been degraded

SMART/Health Information (NVMe Log 0x02)

<snip>
Percentage Used:                    112%
<snip>

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS  Message
  0       4357     0  0x0010  0x4004      -            0     0     -  Invalid Field in Command

Self-test Log (NVMe Log 0x06)
Self-test status: No self-test in progress
No Self-tests Logged

나는 smartmontools 버전 7.4를 실행하고 있기 때문에 "명령의 잘못된 필드" 오류가 빨간색 청어인 것 같습니다.https://www.smartmontools.org/ticket/1222테스트가 실패하지 않도록 수정되었습니다.

그런 다음 나는 다음을 실행했습니다.

$ sudo smartctl -t short /dev/nvme0n1

이제 sudo smartctl --all /dev/nvme0n1다음으로 끝납니다:

Self-test Log (NVMe Log 0x06)
Self-test status: No self-test in progress
Num  Test_Description  Status                       Power_on_Hours  Failing_LBA  NSID Seg SCT Code
 0   Short             Completed: failed segments             3535            -     1   2   -    -
 1   Short             Completed: failed segments             3535            -     1   2   -    -

하지만 "실패한 조각"에 대한 추가 정보를 얻는 방법을 모르겠습니다.

디스크가 손상되어 교체해야 한다고 결론을 내리기에 충분합니까, 아니면 아직 희망이 있습니까?

답변1

중요한 경고는 비트필드가 장치 자체에서 직접 읽힌다는 것입니다. 그런 다음 smartmontools가 이를 보여줍니다. 따라서 smartmontools 자체는 수행하지 않는 설명을 찾고 있는 것입니다. 기술적으로 smartctl은 X 또는 Y 이유 때문에 이를 표시하지 않습니다. 드라이브 펌웨어는 자체적으로 오류 비트를 설정합니다.

바라보다NVM Express® 기본 사양, 그림 208, 200페이지이 특정 중요 경고 비트는 다음과 같이 설명됩니다.

심각한 경고:이 필드는 컨트롤러 상태에 대한 심각한 경고를 나타냅니다. 각 비트는 심각한 경고 유형에 해당하며 여러 비트를 "1"로 설정할 수 있습니다. 비트가 '0'으로 지워지면 이 중요 경고가 적용되지 않습니다. 심각한 경고로 인해 호스트에 비동기 이벤트 알림이 발행될 수 있습니다. 이 필드의 비트는 로그 페이지 가져오기 명령이 처리될 때의 상태를 나타내며 연관된 비동기 이벤트 알림(있는 경우)이 발생하거나 발생할 때의 상태를 반영하지 않을 수 있습니다.

비트: 2 | 정의: '1'로 설정되면 주요 미디어 관련 오류 또는 NVM 하위 시스템 신뢰성을 감소시키는 내부 오류로 인해 NVM 하위 시스템 신뢰성이 감소되었습니다.

(여기서 비트는 0부터 계산되기 시작하므로 심각한 경고(0x04)는 비트 2입니다.)

비트를 설정하기에 충분한 백분율을 사용하고 있습니까? 이것은 가능하다. Google에서 Samsung EVO SSD의 smartctl 출력을 검색했는데, 사용률이 100%를 넘는 몇 가지 항목이 모두 설정되어 있었습니다.

그래도 자체 테스트에서는 실패한 세그먼트가 표시되어서는 안 됩니다. 어쩌면 긴 자체 테스트와 불량 블록(-n 또는 -w를 사용하지 않음) 또는 dd에 대한 읽기 전용 테스트를 실행할 수 있을까요?

의심스러운 경우: 드라이브를 교체하십시오.

관련 정보