문제를 진단하기 위해 충돌로 인한 커널 패닉 메시지를 어떻게 분석할 수 있습니까?

Question

빠른 답변:

이것은 다음과 비슷해 보입니다.커널 버그 #13998(아래에서 내가 이 결론에 도달한 방법을 참조하십시오.) 이 결론은 이후 커널 버전에서 재현되지 않았습니다. 이 경우 최신 커널(또는 최신 버전의 CentOS, 동일한 차이점)로 업그레이드하세요.~해야 한다모듈과 관련된 문제를 해결합니다 fscache.

fscache문제에 대한 단서:

PANIC: "BUG: unable to handle kernel NULL pointer dereference at 000000000000002"

커널이 의미가 없는 메모리 주소를 로드하려고 시도하고 있음을 의미합니다.

COMMAND: "kslowd002"

이것은 패닉이 발생할 때 커널이 실행하려고 하는 명령입니다. 이것이 반드시 충돌을 일으킨 명령이라는 의미는 아니지만 좋은 출발점이 됩니다. 무엇인가요 kslowd? 잘 읽어보세요여기.

역추적에서:

#9 [ffff880100003dd8] fscache_object_slow_work_execute at ffffffffa0460e9f [fscache]

이전에 실행된 마지막 프로세스입니다.

[exception RIP: unknown or invalid address]

이는 커널이 역참조할 수 없는 NULL 포인터입니다. 즉, 커널이 찾으려고 하지만 존재하지 않기 때문에 찾을 수 없는 메모리의 위치입니다. 이것은 알려진 버그 fscache이며 이후 커널 버전에서는 해결된 것으로 보입니다.

여기이는 해결되지 않은 동일한 문제에 대한 CentOS-6 관련 버그 보고서(#0007782)입니다. CentOS 권장 사항에는 커널이 사용 가능한 최신 버전인지 확인하는 것도 포함됩니다. 이 경우 CentOS의 다음 안정적인 주요 버전으로 업그레이드해야 할 수도 있습니다.

이러한 크래시 덤프를 읽는 방법에 대한 자세한 내용을 보려면 다음 튜토리얼을 적극 권장합니다. http://www.dedoimedo.com/computers/crash-analyze.html

Answer 1