가끔 서버가 시작 후 갑자기 종료되었다가 약 5분 후에 자동으로 다시 시작되는 경우가 있습니다.

가끔 서버가 시작 후 갑자기 종료되었다가 약 5분 후에 자동으로 다시 시작되는 경우가 있습니다.

Wake on LAN을 통해 홈 서버를 깨웁니다. 대부분의 경우 약 45초 후에 머신에 SSH를 통해 연결할 수 있습니다. 정말 괜찮습니다. 마지막 로그인이 아주 오래 전(몇 시간) 되었을 때 약 45초가 지나서 바로 서버에 접속이 안되는 것 같습니다. 그래도 5분 정도 기다려야 들어갈 수 있었어요. /var/log/에서 힌트를 찾을 수 없습니다. 이것이 내가 관찰할 수 있는 것입니다:

ME@Laptop:~$ date
Wed 29 Dec 2021 07:04:57 PM CET

ME@Laptop:~$ wakeonlan 17:F2:42:54:04:A6
Sending magic packet to 255.255.255.255:9 with 17:F2:42:54:04:A6

ME@Laptop:~$ ping 192.168.0.201
PING 192.168.0.201 (192.168.0.201) 56(84) bytes of data.
From 192.168.0.22 icmp_seq=1 Destination Host Unreachable
From 192.168.0.22 icmp_seq=2 Destination Host Unreachable
...
From 192.168.0.22 icmp_seq=35 Destination Host Unreachable
From 192.168.0.22 icmp_seq=36 Destination Host Unreachable
64 bytes from 192.168.0.201: icmp_seq=38 ttl=64 time=8.96 ms       <--- There it is shortly
From 192.168.0.22 icmp_seq=78 Destination Host Unreachable         <--- ... and gone!
From 192.168.0.22 icmp_seq=79 Destination Host Unreachable
...
From 192.168.0.22 icmp_seq=361 Destination Host Unreachable
From 192.168.0.22 icmp_seq=362 Destination Host Unreachable
64 bytes from 192.168.0.201: icmp_seq=363 ttl=64 time=1352 ms
64 bytes from 192.168.0.201: icmp_seq=364 ttl=64 time=329 ms
...
64 bytes from 192.168.0.201: icmp_seq=389 ttl=64 time=2.03 ms
64 bytes from 192.168.0.201: icmp_seq=390 ttl=64 time=4.15 ms
^C
--- 192.168.0.201 ping statistics ---
390 packets transmitted, 29 received, +273 errors, 92.5641% packet loss, time 1100ms
rtt min/avg/max/mdev = 1.714/62.398/1352.149/250.840 ms, pipe 4

ME@Laptop:~$ ssh S02
ME@s02's password: 
Linux S02 4.19.0-18-amd64 #1 SMP Debian 4.19.208-1 (2021-09-29) x86_64

The programs included with the Debian GNU/Linux system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent
permitted by applicable law.
Last login: Wed Dec 29 11:28:52 2021 from 2001:4dd7:2e8c:0:61de:9f:e12f:ba74

ME@Server:~$ sudo shutdown now
[sudo] Passwort für ME: 
Connection to s02 closed by remote host.
Connection to s02 closed.

ME@Laptop:~$ ping 192.168.0.201
PING 192.168.0.201 (192.168.0.201) 56(84) bytes of data.
^C
--- 192.168.0.201 ping statistics ---
12 packets transmitted, 0 received, 100% packet loss, time 262ms

ME@Laptop:~$ date
Wed 29 Dec 2021 07:12:53 PM CET

ME@Laptop:~$ wakeonlan 17:F2:42:54:04:A6
Sending magic packet to 255.255.255.255:9 with 17:F2:42:54:04:A6

ME@Laptop:~$ ping 192.168.0.201
PING 192.168.0.201 (192.168.0.201) 56(84) bytes of data.
From 192.168.0.22 icmp_seq=1 Destination Host Unreachable
From 192.168.0.22 icmp_seq=2 Destination Host Unreachable
...
From 192.168.0.22 icmp_seq=38 Destination Host Unreachable
From 192.168.0.22 icmp_seq=39 Destination Host Unreachable
64 bytes from 192.168.0.201: icmp_seq=40 ttl=64 time=493 ms          <--- There it is and it stays on!!!
64 bytes from 192.168.0.201: icmp_seq=41 ttl=64 time=1.67 ms
...
64 bytes from 192.168.0.201: icmp_seq=264 ttl=64 time=2.09 ms
64 bytes from 192.168.0.201: icmp_seq=265 ttl=64 time=2.82 ms
^C
--- 192.168.0.201 ping statistics ---
265 packets transmitted, 226 received, +39 errors, 14.717% packet loss, time 512ms
rtt min/avg/max/mdev = 1.631/5.289/493.460/32.711 ms, pipe 4

ME@Laptop:~$ date

시스템이 갑자기 충돌한 이유를 어떻게 설명할 수 있나요? 약 5분 후에 마법처럼 자동으로 재부팅된다는 것을 어떻게 설명할 수 있나요? 무슨 일이 일어났는지 어디서 확인할 수 있나요? 나는 이것이 온도 문제가 아니라고 굳게 믿습니다. 이것은 몇 시간 후에 기계를 콜드 스타트할 때만 발생하기 때문입니다. 수동으로 종료하고 원치 않는 재부팅 후 즉시 시작하면 더 이상 문제가 없는 것 같습니다.

답변1

마침내 문제를 파악할 수 있었습니다. Debian 운영 체제에서 직접 작업을 수행할 필요는 없습니다. 이것은 하드웨어 문제입니다. 이 게시물에 더 나은 태그를 추가하려고 노력하겠습니다. 누군가에게 도움이 될 수도 있습니다. 이 게시물은 다른 포럼에 속해 있으므로 변경할 수 없습니다.

내 ASUS 마더보드 P8P67-M Pro에 RAM 메모리 모듈에 문제가 있는 것 같습니다. 마더보드에는 내가 수집한 메모리 모듈 지식 중 일부를 활성화하고 BIOS에 저장하는 MemOK! 스위치가 있습니다. MemOK!가 부팅 시 빨간색으로 켜지기 전에 DRAM LED를 활성화한 다음 부팅 후 갑자기 꺼지고 몇 분 후에 이상하게 재부팅됩니다. 자동으로 다시 시작한 후에는 모든 것이 괜찮아 보입니다. 마더보드는 메모리 모듈 통신에 대한 해결 방법을 찾아야 한다는 사실을 마더보드가 기억하고 있는 것처럼 다음에 수동으로 종료하고 전원을 켰을 때 제대로 작동하는 것 같습니다. 전원을 끄고 몇 시간이 지나자 마더보드가 수리 방법을 잊어버린 듯 문제가 다시 나타났습니다. Mem-OK를 사용하세요! 수동으로 보드를 영구적으로 기억에 남게 만드는 것 같습니다. 안타깝게도 컴퓨터를 분리하려면 MemOK! 스위치를 수동으로 다시 눌러야 합니다. 따라서 컴퓨터가 갑자기 자동으로 재부팅되는 Asus 마더보드를 사용하는 사람에게 드리는 조언은 DRAM LED를 확인하고 결국에는 MemOK! 스위치(있는 경우)를 사용하여 마더보드가 수동으로 학습하도록 하라는 것입니다. 그런데, 네, 이전에 BIOS를 최신 버전으로 업데이트하고 마더보드에 새 배터리를 설치했습니다. 저의 특별한 경우에는 OS를 다시 설정해야 했습니다. UEFI에서는 BIOS 업데이트 후에 설치된 데비안을 선택할 수 없었습니다. ASUS 지원에는 운영 체제를 다시 설치하는 것 외에는 다른 해결 방법이 없습니다. BIOS를 업데이트할 때 주의하세요. 하지 않는 것이 좋습니다. ;-) 이것이 누군가에게 도움이 되기를 바랍니다.

관련 정보