Linux 서버가 응답하지 않고 이유를 알 수 없습니까?

Linux 서버가 응답하지 않고 이유를 알 수 없습니까?

서버가 응답하지 않으면(ping 또는 ssh를 실행할 수 없음) 콘솔(ipmitool을 통해 액세스)도 공백으로 나타나거나 출력이 없거나 응답하지 않습니다. 호스트를 재설정/소프트 스타트하면 제대로 작동하고 서버와 콘솔 모두 잘 작동합니다. 지금까지 조사 과정에서 알아낸 사실은 다음과 같습니다.

  1. 서버 로드(CPU, 메모리, I/O 등)가 전혀 표시되지 않습니다.
  2. /var/log/messages에 오류가 표시되지 않습니다.
  3. 호스트가 응답하지 않으면 메시지 파일 업데이트가 중지됩니다.
  4. 하드웨어 문제가 확인되지 않음
  5. 일부 호스트는 이 작업을 자주(예: 매일) 수행합니다.
  6. 분명히 이것은 네트워크 문제로 인한 것이 아닙니다

이 문제를 해결하는 방법에 대한 제안을 주시면 감사하겠습니다. 제가 사용할 수 있는 도구나 로그도 매우 도움이 될 것입니다. 우리는 공급업체로부터 어떠한 지원도 받지 않습니다.

답변1

kdump서비스를 활성화하고 직렬 콘솔이 ipmi를 통해 크래시 덤프를 시작하도록 허용하는 것이 좋습니다 .매직 Sysrq 키(크래시 덤프는 "c"입니다).

저장된 커널 크래시 덤프를 사용하면 문제가 발생했을 때 무슨 일이 일어났는지 조사할 수 있습니다.

이미 ipmi가 있으므로 커널 매개변수에서 SOL 장치를 콘솔로 설정하여 계속 실행할 수도 있습니다. 시스템 로그를 원격 호스트로 보내는 것도 좋은 생각입니다.

관련 정보