Dell D400 노트북에서 우분투 10.10을 실행하고 있습니다. NexStar3 USB 인클로저에 장착된 WD Scorpio Blue 2.5" 드라이브의 LVM 볼륨에서 시스템을 부팅하고 실행했습니다.
대부분의 경우 이것은 매우 잘 작동합니다. 그러나 약 며칠이 지나면 일반적으로 시스템은 시스템 파티션에 대한 액세스를 잃게 됩니다. 정확히 무슨 일이 일어나고 있는지 잘 모르겠고 관련 시스템 유틸리티에 액세스할 수 없기 때문에 진단하기가 어렵습니다.
$ mount
bash: /bin/mount: Input/output error
$ ls
Bus error
$ tail /var/log/messages
bash: /usr/bin/tail: Input/output error
$ cat /var/log/messages
Segmentation fault
닫는 것조차 깔끔하게 완료되지 않습니다.
$ sudo shutdown -h now
bash: /usr/bin/sudo: Input/output error
$ sudo halt
bash: /usr/bin/sudo: Input/output error
내가 찾은 유일한 복구 절차는 전원 버튼을 몇 초 동안 길게 눌러 하드 재부팅하는 것입니다.
이 오류 상태가 활성화되면 인클로저 LED가 계속 켜져 있습니다. 일반적으로 계속 깜박입니다.
내부 드라이브에서 시스템 파일을 마이그레이션했습니다. 마이그레이션 전에는 이러한 문제가 없었습니다. 얼마 지나지 않아 시작된 것으로 기억되는 것 같습니다.
고쳐 쓰다
원격 로깅에 대한 Gilles의 제안에 따라 다음과 같은 syslog
출력이 생성되었습니다.
<6>Aug 12 01:00:25 box kernel: [229825.120148] usb 1-5: reset high speed USB device using ehci_hcd and address 2
<3>Aug 12 01:00:26 box kernel: [229825.700267] usb 1-5: device not accepting address 2, error -71
<3>Aug 12 01:00:26 box kernel: [229825.758145] ehci_hcd 0000:00:1d.7: port 5 reset error -110
<3>Aug 12 01:00:26 box kernel: [229825.758160] hub 1-0:1.0: hub_port_status failed (err = -32)
<6>Aug 12 01:00:26 box kernel: [229825.960116] usb 1-5: USB disconnect, address 2
<6>Aug 12 01:00:26 box kernel: [229825.980062] sd 2:0:0:0: Device offlined - not ready after error recovery
<6>Aug 12 01:00:26 box kernel: [229825.980108] sd 2:0:0:0: [sdb] Unhandled error code
<6>Aug 12 01:00:26 box kernel: [229825.980112] sd 2:0:0:0: [sdb] Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
<6>Aug 12 01:00:26 box kernel: [229825.980118] sd 2:0:0:0: [sdb] CDB: Read(10): 28 00 31 b1 a0 35 00 00 20 00
<3>Aug 12 01:00:26 box kernel: [229825.980132] end_request: I/O error, dev sdb, sector 833724469
<3>Aug 12 01:00:26 box kernel: [229825.980167] Buffer I/O error on device dm-1, logical block 44564614
<4>Aug 12 01:00:26 box kernel: [229825.980171] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229825.984068] Aborting journal on device dm-4-8.
<3>Aug 12 01:00:26 box kernel: [229825.984100] Buffer I/O error on device dm-4, logical block 1081344
<4>Aug 12 01:00:26 box kernel: [229825.984104] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984113] JBD2: I/O error detected when updating journal superblock for dm-4-8.
<3>Aug 12 01:00:26 box kernel: [229825.984181] Buffer I/O error on device dm-4, logical block 1675867
<4>Aug 12 01:00:26 box kernel: [229825.984185] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984190] Buffer I/O error on device dm-4, logical block 1675868
<4>Aug 12 01:00:26 box kernel: [229825.984193] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984200] Buffer I/O error on device dm-4, logical block 1684657
<4>Aug 12 01:00:26 box kernel: [229825.984204] lost page write due to I/O error on dm-4
<4>Aug 12 01:00:26 box kernel: [229825.984389] JBD2: Detected IO errors while flushing file data on dm-4-8
<43>Aug 12 01:00:26 box rsyslogd: /var/log/syslog
<43>Aug 12 01:00:26 box rsyslogd: /var/log/kern.log
<43>Aug 12 01:00:26 box rsyslogd: /var/log/messages
<2>Aug 12 01:00:26 box kernel: [229825.991754] EXT4-fs error (device dm-4): ext4_journal_start_sb: Detected aborted journal
<2>Aug 12 01:00:26 box kernel: [229825.991765] EXT4-fs (dm-4): Remounting filesystem read-only
<3>Aug 12 01:00:26 box kernel: [229826.136474] Buffer I/O error on device dm-1, logical block 44726233
<4>Aug 12 01:00:26 box kernel: [229826.136480] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.136487] Buffer I/O error on device dm-1, logical block 44726234
<4>Aug 12 01:00:26 box kernel: [229826.136491] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.144081] Aborting journal on device dm-1-8.
<3>Aug 12 01:00:26 box kernel: [229826.144099] Buffer I/O error on device dm-1, logical block 13139968
<4>Aug 12 01:00:26 box kernel: [229826.144103] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.144110] JBD2: I/O error detected when updating journal superblock for dm-1-8.
<0>Aug 12 01:00:26 box kernel: [229826.144124] journal commit I/O error
밑에서 10번째 줄인 229825.991765는 파일 시스템이 읽기 전용 모드로 다시 마운트되는 위치입니다. 나머지 부분을 검사했지만 완전히 제거되었다는 내용은 아무것도 볼 수 없었습니다. 따라서 시스템 자체에 액세스할 수 없게 된 이유는 약간 미스터리입니다.
그럼에도 불구하고 처음에 USB 오류가 충돌의 원인인 것 같습니다.
노트북 USB 컨트롤러/드라이버에 문제가 있을 수 있나요? 아니면 USB 인클로저를 사용할 가능성이 더 높습니까? 내가 어떻게 알아?
답변1
좋지 않은 것 같습니다. dmesg를 사용하여 커널에 문제가 있는지 확인하지만 이 명령도 실패할 수 있습니다. 많은 Linux 배포판은 콘솔 10에 커널 메시지를 표시하며 Ctrl-Alt-F10을 사용하여 해당 메시지로 이동할 수 있습니다.
답변2
수면 문제인가요? 커널 라인 apm=off
에서 칩셋이 계속 깨어 있는지 확인할 수 있습니다. acpi=off
또한 BIOS 설정을 확인하고 장치를 절전 모드로 전환하려고 하지 않는지 확인하세요.
hdparm
또한 잠시 후 드라이브가 절전 모드로 전환되는지 확인할 수 있습니다 . 세부 사항을 즉시 기억하지 마십시오. pinfo hdparm
그렇지 않으면 man hdparm
도움이 될 수 있습니다.
답변3
입력 및 출력 오류는 일부 데이터가 손실됨을 의미합니다. 이는 파이프라인에 대한 정보가 거의 신뢰할 수 없음을 의미합니다.
진단 부분을 건너뛰고 데이터 복구 시나리오를 고려하겠습니다.