을 기반으로eblock의 조언smartctl
, 문제를 확인하기 위해 지난 며칠 동안 여러 번 실행했습니다. 예를 들어 출력은 다음과 같습니다 sudo smartctl -a /dev/nvme0n1p2
.
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: Samsung SSD 970 EVO Plus 500GB
Serial Number: S4EVNZFN503427W
Firmware Version: 2B2QEXM7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 500,107,862,016 [500 GB]
Unallocated NVM Capacity: 0
Controller ID: 4
Number of Namespaces: 1
Namespace 1 Size/Capacity: 500,107,862,016 [500 GB]
Namespace 1 Utilization: 94,943,219,712 [94.9 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 5501ad2a18
Local Time is: Wed Dec 2 11:19:04 2020 CET
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 85 Celsius
Critical Comp. Temp. Threshold: 85 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.80W - - 0 0 0 0 0 0
1 + 6.00W - - 1 1 1 1 0 0
2 + 3.40W - - 2 2 2 2 0 0
3 - 0.0700W - - 3 3 3 3 210 1200
4 - 0.0100W - - 4 4 4 4 2000 8000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 38 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 382,321 [195 GB]
Data Units Written: 695,579 [356 GB]
Host Read Commands: 4,525,857
Host Write Commands: 9,680,786
Controller Busy Time: 30
Power Cycles: 205
Power On Hours: 75
Unsafe Shutdowns: 73
Media and Data Integrity Errors: 0
Error Information Log Entries: 209
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 38 Celsius
Temperature Sensor 2: 41 Celsius
Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
"SMART 전체적 건강 자가 평가 테스트 결과: 통과" 및 "기록된 오류 없음"이라는 줄은 안심할 수 있는 것처럼 보이지만 다음 줄은 그렇지 않습니다.
Unsafe Shutdowns: 73
~에 따르면NVMe 명령줄 도구를 사용하여 NVMe 플래시 상태 확인작성자: Peter Zaitsev(2017년 2월), 안전하지 않은 종료는 의미합니다.
종료 알림을 보내지 않고 발생한 정전 횟수입니다. 사용 중인 NVMe 장치에 따라 안전하지 않은 종료로 인해 사용자 데이터가 손상될 수 있습니다.
내 Tuxedo 노트북이 예기치 않게 여러 번 종료되었습니다(참조:예상치 못한 정전의 원인을 로그 파일을 통해 알 수 있는 방법이 있나요?) 그러나 73번은 아닙니다.
~에 따르면이 포럼 게시물은 Tom's Harware(2019년 4월)에 있습니다., 빠른 시작을 비활성화하면 도움이 될 수 있습니다. 이것이 맞습니까? 아니면 다른 것이 필요합니까?
답변1
어떤 이유에서인지 저는 이 SMART 매개변수가 정확하다고 생각하지 않습니다. 내 SSD를 예로 들면 다음과 같습니다.
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 75
이 SSD의 수명 동안 재설정 버튼을 눌렀거나 전원이 20회 미만으로 손실되었으므로 이는 분명히 잘못된 것입니다.
상대적으로 안전해야 하는 이유는 종료하기 전에 systemd
커널이 버퍼를 플러시하라는 지시를 받기 때문에 모든 더티 캐시가 실제로 장치에 덤프되기 때문입니다.
정기적으로 적절한 백업을 수행하는 것을 잊지 마십시오. 이것이 가장 중요합니다.