징후:

징후:

솔직히 이 질문/질문의 제목을 무엇으로 지정해야 할지 모르겠습니다...

내 기본 홈 서버에 두통을 일으키는 특수 드라이브가 있습니다. 방금 미디어 라이브러리 재구성을 마쳤습니다(사진 정렬 및 이름 바꾸기, 중복 제거...). 많은 작업이었는데 이제 다시 조립한 드라이브가 고장이 나거나 제대로 작동하지 않습니다.

이것은 ext4 파티션이 하나만 있는 2009 Seagate Barracuda ST31000528AS, 1TB, 7200rpm입니다.

드라이브는 여전히 읽고 쓸 수 있지만 매우 느립니다(아래 참조).

이것이 하드웨어 오류인지 파일 시스템 문제인지 파악하는 데 도움을 주실 수 있나요? 나는 이 드라이브에 대한 믿음을 잃었기 때문에 앞으로 반드시 교체할 것입니다. 하지만 그 데이터는 나에게 여전히 중요합니다. 그렇다면 데이터를 복사하는 데 21일이 소요됩니까? 아니면 이 포럼의 마법사가 드라이브를 작동 순서로 되돌릴 수 있습니까?

편집하다생각해보면 꽤 오래된 메인보드일 수도 있겠네요. 이제 다른 SATA 포트를 사용해 보겠습니다.

편집 2이전 편집에 따르면 마더보드의 다른 SATA 포트로 전환하여 실제로 모든 문제를 해결했습니다. 로그에 오류가 없고 IO 오류도 없으며 처리량은 100MB/s입니다. 드라이브는 정상인데 마더보드는 정상이 아닙니다!

징후:

  • badblocks처음 233,000개 블록에 대해서는 아무것도 반환되지 않았습니다(전체 블록의 0.1%, 1시간 이상 소요).
  • 아래 출력은 다른 IO가 실행되는 동안 dmesg매초마다 반복됩니다 .badblocks
  • /dev/sdbUDMA2를 실행하는 유일한 드라이버입니다.
  • 때때로다시 시작한 후일부재부팅에서 재부팅까지의 변경 사항에 영향을 미치는 I/O 오류가 발생하는 디렉터리 수

HD 매개변수

# hdparm -tT /dev/sdb

/dev/sdb:
 Timing cached reads:     2 MB in 28.84 seconds =  71.02 kB/sec
 Timing buffered disk reads:   2 MB in 40.20 seconds =  50.94 kB/sec
# hdparm -i /dev/sdb
/dev/sdb:

 Model=ST31000528AS, FwRev=CC38, SerialNo=9VP32GR8
 Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs RotSpdTol>.5% }
 RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4
 BuffType=unknown, BuffSize=unknown, MaxMultSect=16, MultSect=off
 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=1953525168
 IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
 PIO modes:  pio0 pio1 pio2 pio3 pio4 
 DMA modes:  mdma0 mdma1 mdma2 
 UDMA modes: udma0 udma1 *udma2 udma3 udma4 udma5 udma6 
 AdvancedPM=no WriteCache=enabled
 Drive conforms to: unknown:  ATA/ATAPI-4,5,6,7

 * signifies the current active mode

정보

# dmesg
[...]
[13892.088412] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[13892.091432] ata2.00: configured for UDMA/33
[13892.091459] sd 3:0:0:0: [sdb] tag#11 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[13892.091465] sd 3:0:0:0: [sdb] tag#11 Sense Key : Illegal Request [current] 
[13892.091471] sd 3:0:0:0: [sdb] tag#11 Add. Sense: Unaligned write command
[13892.091477] sd 3:0:0:0: [sdb] tag#11 CDB: Read(10) 28 00 10 1f f9 00 00 01 00 00
[13892.091484] blk_update_request: I/O error, dev sdb, sector 270530816 op 0x0:(READ) flags 0x80700 phys_seg 32 prio class 0
[13892.091527] ata2: EH complete
[13892.148412] ata2.00: exception Emask 0x50 SAct 0x600000 SErr 0x280900 action 0x6 frozen
[13892.148430] ata2.00: irq_stat 0x08000000, interface fatal error
[13892.148441] ata2: SError: { UnrecovData HostInt 10B8B BadCRC }
[13892.148451] ata2.00: failed command: READ FPDMA QUEUED
[13892.148468] ata2.00: cmd 60/00:a8:00:fa:1f/01:00:10:00:00/40 tag 21 ncq dma 131072 in
                        res 40/00:b0:00:f9:1f/00:00:10:00:00/40 Emask 0x50 (ATA bus error)
[13892.148486] ata2.00: status: { DRDY }
[13892.148494] ata2.00: failed command: READ FPDMA QUEUED
[13892.148510] ata2.00: cmd 60/08:b0:00:f9:1f/00:00:10:00:00/40 tag 22 ncq dma 4096 in
                        res 40/00:b0:00:f9:1f/00:00:10:00:00/40 Emask 0x50 (ATA bus error)
[13892.148528] ata2.00: status: { DRDY }
[13892.148537] ata2: hard resetting link
[...]

FSCK

# fsck -n /dev/sdb1
fsck from util-linux 2.34
e2fsck 1.45.5 (07-Jan-2020)
Warning!  /dev/sdb1 is in use.                                                 # yes, it is unmounted
Warning: skipping journal recovery because doing a read-only filesystem check.
1TB_2 contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
Free blocks count wrong (192424920, counted=192786254).
Fix? no

Free inodes count wrong (61035970, counted=61039035).
Fix? no

1TB_2: 19006/61054976 files (15.0% non-contiguous), 51765470/244190390 blocks

답변1

귀하의 질문은 실제로 Unix가 아닌 하드웨어 관련 문제에 관한 것입니다. 소프트웨어를 사용하여 하드웨어와 상호 작용하는 방법을 아는 것은 좋지만 하드웨어 작업 경험이 있으면 생활이 더 쉬워집니다.

나는 거의 10년 동안 컴퓨터 수리를 해왔는데 당신이 설명하는 모든 증상은 하드웨어 고장의 징후입니다.

수백 대의 고장난 컴퓨터를 처리한 경험에 따르면 소비자 HDD의 수명은 약 15-20,000시간입니다. 그 후에는 수많은 불량 섹터와 다양한 기계적 문제가 발생할 수 있습니다. 반면에 저는 아무 문제 없이 연중무휴 8만 시간 이상 실행되는 HD(Seagate OEM)의 엔터프라이즈급 드라이브 12개를 가지고 있습니다. 귀하의 하드 드라이브는 2009년에 출시된 값싼 구형 소비자용 하드 드라이브일 뿐입니다. 아마도 무슨 일이 일어났는지 추측할 수 있을 것입니다.

읽기/쓰기 속도가 느리다는 것은 드라이브 헤드가 디스크의 예약된 영역으로 앞뒤로 이동해야 하기 때문에 하드 드라이브에 불량 섹터가 많다는 것을 의미합니다. 전체 검색 중 무작위 IO 오류 및 정지는 불량 섹터가 너무 많다는 것을 의미합니다. 소음이 난다면 드라이브 헤드에 결함이 있다는 의미이기도 합니다.

마더보드 오류로 인해 드라이브 속도가 느려지지는 않습니다. 문제가 분명하기 때문에 시스템 로그와 소프트웨어 테스트를 뒤지는 데 시간을 낭비하지 않을 것입니다. 확신이 필요하다면 빠른 SMART 테스트를 받아보세요. 저는 SMART 테스트에 Linux 대신 Windows를 사용하는 것이 더 쉽기 때문에 선호합니다.

추신: 이제 데이터와 작별할 시간입니다. 손상된 섹터에서 데이터를 복구할 수 없습니다. 섹터가 불량해지면 해당 섹터에 저장된 데이터가 영원히 손실됩니다.

관련 정보