전체 정지 원인을 어떻게 조사합니까?

전체 정지 원인을 어떻게 조사합니까?

내 Arch 시스템이 때때로 멈추고 갑자기 마우스나 키보드에 응답하지 않게 됩니다. 커서가 고정되어 있습니다. Ctrl-Alt-Backsp는 X11을 중지하지 않으며 ctrl-alt-del은 아무 작업도 수행하지 않습니다. conky 및 icewm의 CPU, 네트워크 및 디스크 활동 그래프 업데이트가 중지되었습니다. 몇 분 후에 팬이 켜집니다. 컴퓨터가 어떤 일을 하도록 하는 유일한 방법은 전원을 끄는 것입니다.

시작 시 CPU 온도 모니터에 70~80C가 표시됩니다. 매달리기 전에는 주로 섭씨 50도 정도의 온도에서 웹 서핑과 같은 저강도 활동을 합니다.

로그에는 일반적인 종료와 비교하여 특별한 내용이 표시되지 않습니다. 메모리 검사기는 결함 없이 훌륭하게 작동합니다.

정지 원인을 어떻게 조사합니까? 단서를 찾기 위해 추가 정보를 찾을 수 있나요? 제한된 케이싱이나 경고음일지라도 일종의 조치를 취하기 위해 전원을 끄는 것보다 덜 과감한 것이 무엇입니까? 단서를 제공할 수 있습니까?

기기는 최신 버전(2011년 3월 기준)인 Arch 64비트를 실행하는 Gateway P6860 17인치 노트북(무겁지만 강력함)입니다. 나는 이 문제 없이 오랫동안 Arch를 사용했고, 약 일주일 동안 Ubuntu로 전환했다가 다시 새로운 Arch 설치로 돌아갔습니다. 이때부터 교수형이 시작됩니다.

업데이트: 예, 확실히 과열되었습니다. 특정 온도에서는 마우스와 키보드가 작동을 멈추고 때로는 몇 분 동안 식힌 후 정상 작동으로 돌아오는 경우도 있습니다. 온도가 높을수록 SysRq 무시를 포함하여 완전한 무응답과 같은 더 나쁜 경우가 발생합니다. 이 상황은 곧 갑작스러운 정전으로 이어집니다. 새 컴퓨터 8D를 구입하고 이 문제를 해결했습니다.

답변1

동결과 관련하여 다음과 같은 옵션이 있습니다.

  • console=ttyS0직렬 포트(상자에 포트가 있는 경우)를 사용하면 위에서 언급한 부팅 옵션을 추가하여 덤프를 얻을 수 있습니다.여기. 덤프 파일을 캡처하려면 직렬 포트와 널 모뎀 케이블이 있는 두 번째 컴퓨터가 필요합니다.

  • netconsole을 사용하여 네트워크를 통해 덤프를 가져오세요.이봐.

  • kexec/kdump를 사용하면 로컬 덤프를 얻을 수 있습니다.이봐.

깨끗한 정전 문제와 관련하여 다음을 사용하는 것이 좋습니다.SysRq 매직 키"S"는 디스크를 동기화하고 "U"는 디스크를 설치한 다음 상자를 "부팅"합니다(alt-sysrq와 함께 입력해야 하는 문자입니다).

편집: oops/trace를 lkml에 게시하는 경우 최신(가급적 최신) 버전의 커널을 사용해야 하며 독점 모듈은 사용하지 않아야 합니다.

답변2

Frederik의 답변에는 SysRq와 코어 덤프의 마법이 포함되어 있습니다. 이는 커널이 계속 실행 중이고 실제로 중단되지 않은 경우 작동합니다. 어떤 이유로 커널이 루핑 중일 수 있습니다.

Ctrl-Alt-Del에 응답하지 않는다는 사실은 아마도 그렇지 않을 것이며 기계가 심하게 잠기고 있다는 것을 말해줍니다. 이는 하드웨어 오류 또는 결함이 있는 드라이버와 같이 밀접하게 관련된 문제를 의미합니다.

충분히 오래 실행하면 메모리 검사 테스트가 제대로 진행됩니다. 시스템에 스트레스를 주기 위해 다음과 같은 다른 방법도 시도해야 합니다.스트레스리눅스. 장기 실행 벤치마크도 좋습니다.

시도해 볼 수 있는 또 다른 방법은 Ubuntu Live CD를 사용하여 시스템을 부팅하고 시스템을 정상적으로 사용해 보는 것입니다. 이와 같이 일시적으로 Ubuntu로 돌아가도 문제가 다시 발생하지 않는다면 실제로 하드웨어 불량이 아니라 결함이 있는 드라이버나 잘못 구성된 커널과 같은 관련 문제 중 하나일 가능성이 높습니다. Ubuntu와 같이 더 널리 사용되는 배포판은 배포판 테스트 단계에서 더 많은 시스템이 시도되기 때문에 Arch와 같은 배포판보다 더 안정적인 커널 구성을 가질 가능성이 높습니다.

관련 정보