"NMI Watchdog: BUG: Soft Lockup"이 하드웨어 또는 소프트웨어 문제인지 어떻게 감지합니까?

"NMI Watchdog: BUG: Soft Lockup"이 하드웨어 또는 소프트웨어 문제인지 어떻게 감지합니까?

소프트 락

dmesg노트북으로 보고해요, 오랜만이에요NMI watchdog: BUG: soft lockup 매번updatedb또는 을 사용해 보았습니다 firefox. 보고서 내용의 샘플은 다음 위치에 게시되어 있습니다.https://github.com/zfsonlinux/zfs/issues/4536#issuecomment-280894134.

관련 질문

나는 또한 다음 항목을 읽고 댓글을 달았습니다.https://github.com/zfsonlinux/zfs/issues/4536

질문

하드웨어 문제인지 또는 커널/소프트웨어 관련 문제인지 어떻게 확인합니까?


세부 사항

리눅스 배포판

Funtoo-Linux, 롤링 분포

핵심

나는 (적어도) 다음 커널 버전에서 "버그"를 관찰했습니다.

퍼프

  • 4.11_p4-pf
  • 4.8_p8
  • 4.5_p4

CK

  • 4.12.7-ck

데비안

  • lts-4.9.30
  • 4.8.x
  • 4.7.8

구성

커널을 컴파일하기 위해 사용자 정의 구성을 사용합니다. 기본적으로 "소프트 잠금" 문제나 "감시" 관련 문제가 없을 때 오랫동안 사용해 왔던 것과 동일한 구성입니다.

구성 파일을 복사하여 붙여넣거나 연결할 수 있습니다. 그러나 "필수"인 두 가지 중요한 설정이 더 있다는 것을 발견했습니다.

CONFIG_KALLSYMS=y
CONFIG_PREEMPT_NONE=y

ZFS

ZoL 버전을 사용할 때 "BUG"가 관찰되었습니다.

  • 0.6.5.11
  • 0.6.5.10
  • 0.6.5.9
  • 0.6.5.8
  • 0.6.5.3

답변1

하드웨어 문제일 수도 있지만,코드 성숙도~의Linux용 ZFS 코드, 그리고 많은 사람들이 여러 버전에서 동일한 메시지에 대해 불평하고 있습니다. 저는 이것이 소프트웨어 버그라고 말하고 싶습니다.

여러 오류가 있습니다경쟁 조건ZFS 코드에서는 프로덕션 시스템에서 여전히 완전히 신뢰할 수 없는 것이 현실입니다.

노트북이 놀이터/테스트 시스템인 경우 ZFS+를 시도하는 것은 소프트웨어와 하드웨어 문제를 해결하는 데 좋은 ZFS 테스트입니다.FreeBSD, 이는 더 테스트되고 안정적인 코드 기반을 가지고 있습니다.

추가 의견에 따르면 과거에 Linux+zfs의 안정적인 구성이 알려진 경우 다시 돌아가서 테스트하여 배제하는 것이 가장 좋습니다.가능한질문.

실제 커널 수준 코드를 디버깅하는 방법은 다음과 같습니다.sysdig그러나 시스템이 중단되면 로그를 쏟아내기 전에 시스템이 종료될 수 있으며, 이것이 문제의 원인일 수도 있고 아닐 수도 있습니다.

관련 정보