내 컴퓨터에 다른 하드웨어 오류가 발생했습니다(아래 그림 참조, 불행하게도 내 경험으로는 디스크에 기록되지 않았습니다). 이는 LAN을 통해 데이터를 전송할 때 가장 자주 발생하며 스트레스-ng를 사용하여 생성할 수 없습니다.
컴퓨터는 또한 24시간 메모리 테스트를 매우 성공적으로 통과했습니다(약 11회 통과). 프로세서는 A10-9700 APU입니다. PSU는 beQuiet Pure 750W이며, 컴퓨터를 청소하고 열 페이스트를 다시 도포했습니다. 이것은 두 번째 PSU입니다(예산이 500W인 Chieftec을 사용하기 전에는 PSU 변경으로 아무런 개선이 이루어지지 않았습니다).
나머지는 스크린샷에 있습니다. 개선 사항 없이 BIOS를 버전 F24로 업데이트했습니다(CPU 지원이 없는 버전은 절대 아님).
통합 그래픽 전용 메모리가 "자동"으로 설정되면 충돌(재시작)되거나 mce 오류가 발생합니다.
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091048] [Hardware Error]: Corrected error, no action required.
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091095] [Hardware Error]: CPU:0 (15:65:1) MC1_STATUS[-|CE|MiscV|-|-|-|-]: 0x9800000000130151
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091160] [Hardware Error]: MC1 Error: Decoder predecode buffer parity error.
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091210] [Hardware Error]: cache level: L1, tx: INSN, mem-tx: IRD
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091302] [Hardware Error]: Corrected error, no action required.
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091344] [Hardware Error]: CPU:0 (15:65:1) MC5_STATUS[-|CE|-|-|-|-|-]: 0x90000000000c0e0f
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091404] [Hardware Error]: MC5 Error: DE error occurred.
Message from syslogd@HOSTNAMEHERE at Mar 1 16:37:14 ...
kernel:[31135.091446] [Hardware Error]: cache level: L3/GEN, mem/io: GEN, mem-tx: GEN, part-proc: GEN (no timeout)
(다른 방식으로) 20~60분마다 - 무작위 재부팅, 로그 정보 없음. 커널이 4.19(Debian Buster: 4.19.0-14-amd64)인 경우에도 동일한 일이 발생합니다. amdgpu 그래픽 드라이버는 현재 "nomodeset" 상태입니다.
지금까지 "CPU가 멈췄습니다"라는 오류는 본 적이 없지만 mce 오류는 다음과 같습니다.
- (설명된 대로) 커널 4.19에서는 20-30분마다
- 커널 5.9 및 5.10에서는 2~10시간마다
두 경우 모두 재부팅이 발생하며 일반적으로 재부팅당 2-4 mce 유형 오류 세션이 발생합니다.
어떻게 해야 합니까?