최근에 중고 데스크톱 컴퓨터를 구입했습니다. 나는 그것에 새로운 Debian Bookworm을 설치했습니다. 무작위로 정지되고 로그에서 아무 것도 찾을 수 없습니다. 오늘도 잘못된 재부팅이 발생했습니다.
무작위로 말하면 어떤 상황이 이를 유발하는지 전혀 알 수 없습니다. 저는 CPU나 I/O를 많이 사용하는 작업을 하지 않습니다. 저는 Xbox 에뮬레이션을 수행하거나 문제 없이 한 하드 드라이브에서 다른 하드 드라이브로 전체 파티션을 복사해 왔습니다.
SSH 액세스 없음, ping 없음, Magic SysRq 키 없음
journalctl
아무것도 제공되지 않습니다. 사고가 발생하기 전에는 대기열이 없었습니다.Xorg 로그에도 아무것도 표시되지 않습니다.
메모리 테스트 통과
하드웨어 사양, FWIIW:
- AMD Ryzen 7 1700X 옥타 코어 프로세서 알 수 없는 CPU @ 3.4GHz
- VGA 호환 컨트롤러: Advanced Micro Devices, Inc. [AMD/ATI] Baffin [Radeon RX 550 640SP / RX 560/560X] (rev cf)
- 24GB RAM
- 28GB 스왑 공간(비어 있음)
- 240GB 솔리드 스테이트 드라이브
/
- 1TB 하드 드라이브
/home
lm-sensors는 SSD 온도를 82°C(180°F)로 보고하지만 케이스의 통풍이 잘되고 디스크가 전혀 뜨겁지 않고 만져도 차갑기 때문에 이는 센서 문제임이 분명합니다. 또한 보고된 온도는 너무 일정하여 현실적이지 않으며 전원을 켠 직후 82°C에 도달합니다. 센서 오류로 인해 고온이 보고될 수 있지만 재부팅이나 정지가 발생하지 않아 안전 종료가 발생할 수 있다고 생각합니다. 그렇죠?
lm-sensors에서는 HDD 30°C, Tctl 47°C, Tdie 27°C도 보고하는데, 이는 제가 아는 한 정상입니다. 또한, 케이스 내부에서는 뜨겁게 "느껴지는" 것이 없습니다.
확실히 하드웨어 문제인 것 같습니다. 각 부분을 하나씩 바꾸는 것 외에도 범인을 찾는 방법을 알고 있나요? 사용할 수 있는 진단 도구가 있습니까?