지연/정지 및 자체 재시작의 원인을 어떻게 알 수 있나요?

지연/정지 및 자체 재시작의 원인을 어떻게 알 수 있나요?
  • 주분투 14.04

  • FF 39.0, Canonical에서 패키징

방금 내 컴퓨터가 입력 없이 거의 정지되고 응답하지 않는 현상을 경험했습니다. 마우스 포인터는 20초마다 약 2mm씩 움직이며 상단 작업 표시줄의 CPU 로드는 1/4 정도 찼습니다(여기서는 XFCE의 "CPU 로드" 위젯에 대해 말하는 것 같습니다). 이 공식 웹사이트에서 iPhone 보안 및 암호화 섹션의 탭을 읽었을 때 이런 일이 일어났습니다.애플 페이지(그저 내가 한 일만 말했을 뿐, 다른 건 없습니다.)

TTY1을 통해 로그인을 시도했지만 입력한 로그인 정보가 허용되지 않았습니다. 실제로는 내가 원래 입력한 내용(예를 들어 john사용자로서)이 허용되었기 때문에 그 후에 Enter 키를 눌렀지만 아무 일도 일어나지 않았습니다. 사용자의 비밀번호를 입력하면 다른 입력과 마찬가지로 TTY1에 표시됩니다. CTRL^C프로세스를 중단하기 위해 키 조합을 누르면 해당 섹션도 표시됩니다.

DE/TTY7을 누른 후 오랜 시간이 지나서 다시 DE/TTY7로 전환되었습니다 CTRL + ALT + F7. Apple 페이지가 계속 표시됩니다.

그런 다음 기계가 거의 2분 동안 계속해서 작업을 수행하는 것을 보았고 재부팅하는 것을 보았습니다. IIRC 종료 메시지에는 "start", "stop", "status" 및 "wait"라는 단어가 포함되어 있습니다.

내가 묻는 것은: 정확히 무엇을 찾아야 합니까 /var/log/syslog? 제가 찾아야 할 다른 것이 있나요?

  • 관련 시점의 시스템 로그

  • 설명: 저는 이더넷 케이블, 키보드, 마우스를 분리했다가 다시 연결한 사람입니다. 다음은 Xubuntu가 이를 인식하고 다시 사용하도록 하는 몇 가지 (절름발이) 시도입니다.

답변1

면책조항: 귀하가 본 메시지에 대한 제 생각은 귀하의 보고 내용과 잘 일치하지 않는 것 같아서 누락된 내용이 있을 수 있습니다.

기본적으로 소프트웨어 재시작 실패의 원인은 많이 생각할 수 없습니다. 하드웨어를 반드시 고려해야 합니다. 어떤 종류의 크래시 덤프를 가져온다고 가정하면 문제가 실제로 하드웨어인지 설명하는 것은 매우 실망스러울 것입니다. 이 시점에서는 RAM 테스트를 수행하는 것이 좋습니다(부팅 memtest86또는 이에 상응하는 테스트). CPU 스트레스 테스트는 과열을 확인하는 데에도 좋습니다. 귀하에 따르면 4개의 명령을 실행하는 데 몇 분밖에 걸리지 않을 수 있습니다 cpuburn.

설명에 따르면 배제해야 할 가장 중요한 점은 메모리가 부족하고 시스템 자체를 교체하여 죽어가고 있다는 것입니다. 재부팅이 발생해서는 안 됩니다. 디스크 표시등이 켜집니다. 100% CPU 사용량은 일반적으로 표시되지 않지만 일부 모니터에서는 CPU가 100% "IO 대기"로 표시될 수 있습니다. 이는 자체 색상이어야 합니다.

<오류, 지금 다시 시작하세요>라는 메시지가 표시되지 않기를 바랍니다. 너가능한삼중 결함 이전의 첫 번째 또는 두 번째 결함의 일부 메시지를 보면 화면이 검게 변합니다. 이러한 메시지는 시스템 로그에 기록되지 않습니다. 외부 커널 콘솔을 설정해야 합니다. (직렬 포트 또는 네트워크 콘솔) 아니면 이것을 시도해 보세요EFI 펌웨어 활용에 대한 간략한 지침을 문서화하세요(있는 경우).. 이것이 더 실용적인 선택일 수 있습니다. pstore 파일 시스템을 아직 설치하지 않은 경우 활성화될지 확실하지 않습니다. 커널 디버깅에 관심이 있다면 이는 멋진 일처럼 보입니다.


일부 구성은 소프트웨어 부팅에서 다시 시작할 수 있습니다. 예를 들어 panic=커널 부팅 옵션 및/또는 감시 타이머가 있습니다. systemd에는 몇 분의 시간 초과가 발생할 수 있는 감시 기능이 있습니다.

나는 귀하의 운영 체제의 기본 설정이 이들 중 하나를 활성화하지 않는다고 생각합니다. (아니요 panic=, 둘 다 시작할 시스템이 없습니다). 아직 활성화하지 않은 경우 몇 가지 소프트웨어 결함으로 인해 재부팅이 발생할 것으로 예상됩니다.

커널 내부(x86) 오류를 처리하는 동안 커널이 오류를 트리거하면 머신이 즉시 재부팅될 수 있습니다. "삼중 실수"라고도 합니다. 그러나 다른 치명적인 커널 오류는 "패닉"을 일으키고 메시지를 인쇄하며 기본적으로 재부팅되지 않습니다.

그렇지 않으면 우리는 그것이 재시작 코드를 호출하는 데 발생한 완전히 미친 버그라고 생각할 것입니다. 아마도 이상한 효과가 있는 미친 버그를 많이 만나지 않는 한 이런 일은 반복되지 않을 것입니다.

어쩌면 우리는 바쁜 기간 동안 발생하는 메모리 손상으로 인해 결국 삼중 오류가 발생하는 것을 목격할 수도 있습니다. 바쁜 기간 동안의 커널 메시지가 이를 설명할 수 있습니다.

관련 정보