Linux 커널 정지

Linux 커널 정지

저는 Intel(icelake) 기반 서버에서 Linux 커널 4.19를 사용하고 있습니다. 때때로 Linux가 부팅된 직후(로그인 프롬프트에서) 작동이 멈추는 경우가 있습니다(재부팅 시 50번 정도). 직렬 터미널이나 모니터에서는 아무 반응도 하지 않습니다. 붙어 있으면 키보드 캡 잠금 표시등이 켜지거나 꺼지지 않습니다. sysrq 요청도 허용하지 않습니다. 복구할 수 있는 유일한 방법은 서버를 재설정하는 것입니다.

디버깅하고 교착 상태 디버깅을 시도했지만 도움이 되지 않았습니다. 이 문제는 10번 또는 때로는 50번의 재부팅 후에 무작위로 발생합니다. 추적이나 죄송합니다 메시지가 없습니다. 어떤 상황에서 이런 일이 발생하나요? 인터럽트 컨텍스트에서 교착 상태가 가능합니까? 그렇다면 이를 디버깅하는 가장 좋은 방법은 무엇입니까? 아니면 일종의 하드웨어 문제일까요? 이 문제를 더 디버깅하려면 어떻게 해야 합니까?

관련 정보