Linux 시스템이 과열되어 마지막으로 부팅되기 전에 종료되었는지 데비안에서 어떻게 알 수 있나요?

Linux 시스템이 과열되어 마지막으로 부팅되기 전에 종료되었는지 데비안에서 어떻게 알 수 있나요?

오늘 저는 원격 컴퓨터(아마도 절대 볼 수 없을 것임)에서 작업 중인데 작동이 중단되어 사용자에게 다시 시작하라고 말했습니다. 기계가 다시 시작되고 나는 ssh그것에 들어갔습니다. 그러나 시작하자마자 온도가 60°C 이상이라는 메시지를 받았기 때문에 커널은 기계를 다시 종료했고 물론 나는 그것과의 연결을 끊었습니다 ssh.

머신을 다시 시작하려고 합니다. 과거에 머신이 너무 뜨거워서 종료되었다는 로그를 읽을 수 있는 방법이 있습니까?

답변1

머신이 과열되면 커널이 시스템을 종료하기 전에 로그 파일에 저장되는 메시지를 생성합니다. systemd설정 의 경우 journalctl명령을 통해 파일에 액세스할 수 있으며 관련 출력은 다음과 같습니다.

Jul 09 05:28:39 jjmach kernel: thermal thermal_zone0: critical temperature reached (96 C), shutting down
Jul 09 05:28:40 jjmach root[27818]: ACPI event unhandled: thermal_zone LNXTHERM:00 000000f0 00000001
Jul 09 05:28:57 jjmach kernel: thermal thermal_zone0: critical temperature reached (96 C), shutting down
Jul 09 05:28:57 jjmach lightdm[174]: Failed to get D-Bus connection
Jul 09 05:28:46 jjmach pppd[17312]: Hangup (SIGHUP)
Jul 09 05:29:00 jjmach org.a11y.Bus[265]: Reloaded configuration
Jul 09 05:28:42 jjmach systemd[1]: Stopping Daemon for power management...

$SYSTEMD_PAGER따라서 less"임계 온도"를 (보통) 직접 검색하거나 직접 검색해야 합니다.

journalctl -g 'temperature|critical'

-b -1마지막으로 실행된 메시지에만 검색을 추가 할 수 있습니다 .


그러고 보면 60°C는 통증유발점으로는 정말 낮은 온도인 것 같아요. 대부분의 CPU는 일반적으로 컴파일이나 기타 리소스가 풍부한 작업 중에 이 온도에 도달합니다. 프로세서에 맞는 올바른 모듈을 모두 로드했는지 확인하고 sensors-detect다음 명령을 사용하여 sensors열 매개변수를 확인하세요 .

관련 정보