![ext4에는 오류가 많은데 smart에서는 오류가 표시되지 않습니다.](https://linux55.com/image/26027/ext4%EC%97%90%EB%8A%94%20%EC%98%A4%EB%A5%98%EA%B0%80%20%EB%A7%8E%EC%9D%80%EB%8D%B0%20smart%EC%97%90%EC%84%9C%EB%8A%94%20%EC%98%A4%EB%A5%98%EA%B0%80%20%ED%91%9C%EC%8B%9C%EB%90%98%EC%A7%80%20%EC%95%8A%EC%8A%B5%EB%8B%88%EB%8B%A4..png)
나는 추가(시스템 디스크가 아님) 1.5Tb SATA 하드 드라이브(WD Caviar Green)가 포함된 Debian 상자를 가지고 있습니다. 전체 디스크에는 파티션이 하나만 있습니다.
디스크는 원격 시스템의 백업( rsnapshot
4시간마다 백업 업데이트 실행) 및 특정 파일의 토렌트에 사용됩니다. 따라서 디스크는 영구적으로 사용 중입니다.
일부 파일 시스템 오류가 발생하기 전까지는 모든 것이 완벽했고 파일 시스템 읽기/쓰기 오류로 인해 많은 파일을 삭제할 수 없었습니다.
fsck
저를 구해 주셨고 한 달에 여러 번 오류가 나타났습니다. 파티션을 마운트 해제하고 실행하여 fsck
모든 오류를 수정해야 할 때마다.
fsck
다양한 파일 시스템 블록 읽기/쓰기를 복구하는 동안 다음과 같은 일부 메시지도 나타났습니다.
Inode 61477311 ref count is 3, should be 2. Fix? yes
Block bitmap differences: -(246948483--246948494) -(246987843--246987871) -(246988756--246988758) -(246989103--246989109). Fix? yes
smartctl
오류가 전혀 표시되지 않습니다.
그렇다면 전체 데이터를 백업하고 포맷해야 할까요? 아니면 하드 드라이브가 수명을 다한 것일까요? 아니면 이 문제를 해결할 수 있는 다른 방법이 있을까요?
PS 이것은 smartctls 출력입니다.
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Green (Adv. Format) family
Device Model: WDC WD15EARS-00Z5B1
Serial Number: WD-WMAVU1111103
Firmware Version: 80.00A80
User Capacity: 1,500,301,910,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (33000) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x3031) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 197 197 051 Pre-fail Always - 36297
3 Spin_Up_Time 0x0027 206 177 021 Pre-fail Always - 4658
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 267
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 12335
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 265
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 57
193 Load_Cycle_Count 0x0032 142 142 000 Old_age Always - 176547
194 Temperature_Celsius 0x0022 120 087 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 3
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 3
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 12335 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
답변1
HDD 또는 컨트롤러가 오작동하고 일부 쓰기가 손실된 것 같습니다.
가능한 한 빨리 전체 백업을 수행하고 전체 오프라인 디스크 검사를 실행하는 것이 좋습니다. 1.5TB 드라이브의 경우 시간이 걸릴 수 있습니다. SMART가 오류를 올바르게 보고하지 못할 수 있으므로 가능하면 SMART 드라이브가 아닌 장치를 사용하여 전체 디스크 검사를 실행하십시오. 이것불량 블록이 페이지 하단의 섹션이 유용할 수 있습니다. 읽기 및 쓰기 테스트를 시도합니다(백업 후).
답변2
RAM이 좋지 않을 수 있습니다. 달리기를 해보세요기억력 테스트약 24시간.
답변3
또한 다음과 같은 메시지를 발견했습니다 dmesg
.
[2429573.624923] ata6.00: status: { DRDY ERR }
[2429573.624945] ata6.00: error: { UNC }
[2429573.632900] ata6.00: configured for UDMA/133
[2429573.632942] ata6: EH complete
[2429576.564846] ata6.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[2429576.564885] ata6.00: irq_stat 0x40000008
[2429576.564910] ata6.00: failed command: READ FPDMA QUEUED
[2429576.564942] ata6.00: cmd 60/08:00:e8:14:c0/00:00:75:00:00/40 tag 0 ncq 4096 in
[2429576.564946] res 41/40:00:e8:14:c0/00:00:75:00:00/40 Emask 0x409 (media error) <F>
Google에서는 데이터 케이블을 교체할 것을 권장합니다. 이제 모든 것이 괜찮아 보입니다. 다들 감사 해요.