"잔인한" 시스템 정지 디버깅(더 이상 Alt+SysRq+B에 응답하지 않음)

"잔인한" 시스템 정지 디버깅(더 이상 Alt+SysRq+B에 응답하지 않음)

일련의 시스템 중단이 발생하고 있으며 최소한 몇 가지 단서를 얻기 위해 크래시 덤프를 얻고 싶지만 즉각적인 재시작 키가 작동하지 않는 경우에도 일반적인 "magic sysrq" 기능도 손상됩니다. 키보드 상태 LED(Caps Lock 등)가 더 이상 전환되지 않습니다. 작동하는 유일한 방법은 컴퓨터의 전원 버튼을 누르고 있는 것입니다.

아래에 더 많은 배경 지식이 있지만 일반적인 질문은 이러한 유형의 중단을 디버깅하는 다음 단계가 무엇인지입니다. 즉, 적어도 호출 스택(범인이 아직 실행 중이라고 가정)과 바람직하게는 이러한 유형의 중단에 특정한 호출 스택을 얻을 수 있는 방법은 무엇입니까? 미니) 디버거가 응답하지 않는 상태입니까?

세부 정보: PS/2 키보드와 함께 상당히 새로운 운영 체제[스톡 LinuxMint 16, 커널 3.11.0-12-generic]를 실행하는 데스크탑 컴퓨터(Dell OptiPlex 7010)입니다. 직렬 포트가 있지만 불행하게도 커널 콘솔에 시험해 볼 수 있는 편리한 다른 머신과 널 모뎀 케이블이 없습니다. 나는 (순진하게) Alt-SysRq가 작동하지 않으면 데스크톱 전환, 넷콘솔 사용 등의 시도가 헛될 것이라고 의심합니다.

또한 추가 정보(아마도 관련이 없음)로서 과부하된 CIFS 네트워크 마운트에 대해 fscache를 사용하면 중단이 발생합니다. 캐시는 작동하지만(/proc/fs/fscache/stats에는 적중 발생이 표시되므로 구성이 완전히 잘못된 것은 아닙니다) 주기적인 "잔인한 정지"가 발생합니다. 커널 로그에는 다음과 같은 암시적인 항목이 있습니다.

FS-Cache: 쿠키 유형 CIFS.uniqueid가 페이지에 여러 번 표시됨 0

적어도 일부 중단에 대해서는. 메모리 테스트는 괜찮고 일시 중지와 fscache 사용 사이의 상관 관계는 꽤 견고하므로 일반적인 하드웨어 문제(RAM, 온도, 우주선...)인 것으로 의심됩니다.

관련 정보