재귀 오류를 수정했지만 x3850 x6 SLES12에서 재부팅이 필요함 [닫기]

재귀 오류를 수정했지만 x3850 x6 SLES12에서 재부팅이 필요함 [닫기]

새로운 머신이 생겼습니다: x3850 x6.

다음과 같은 커널 패닉이 발생하는 한 시스템을 제외하고 모든 px가 정상적으로 부팅됩니다. 이는 흥미로운 문제인 것 같습니다.

여기에 이미지 설명을 입력하세요.

커널 패닉이 발생한 후 30~40초 동안 위로 스크롤할 수도 없었습니다. 너무 느려서 아무 것도 입력할 수 없습니다.

누구든지 단서를 가지고 있습니다., 무엇이 문제일까요? 하드웨어 오류인 경우 무엇을 교체해야 합니까? CPU? 마더보드?

  • BIOS 설정은 작업 설정과 동일합니다.
  • 펌웨어/BIOS 버전은 작동 버전과 정확히 동일합니다.
  • 콜드 부팅을 시도했지만 동일한 커널 패닉이 발생했습니다.
  • 커널 매개변수 "acpi=off"로 부팅을 시도했습니다. 일반적인 30-40초가 아닌 약 18초에 동일한 커널 패닉이 발생했습니다.
  • 시도함: "noapic nomodeset xforcevesa" - 30-40초 후에 패닉 상태가 됩니다.
  • 시도: "acpi=off noapic nomodeset xforcevesa" - 30-40초 후에 패닉이 발생합니다.
  • 시도됨: "isolcpus=0" 부팅 매개변수, 동일한 커널 패닉, 30-40초 후.
  • slacko-5.6-PAE.iso를 시작해 보세요.정상 시작! 3.10.5 SMPPAE. 하지만 우리는 SLES를 사용해야 합니다. PAE 커널은 ~65GB RAM만 볼 수 있습니다(유용한 정보인 경우).
  • 시험을 마친:https://www.memtest86.com/downloads/memtest86-iso.zip간단한 memtest를 실행했지만 메모리 오류 없이 59초 동안 실행한 후 머신이 정지되었습니다. -> 업데이트: Memtest86+:http://www.memtest.org/#downiso얼지 않습니다.

한번은 다음 내용을 보았습니다: "커널 패닉 - 동기화되지 않음: watchdog가 CPU 18에서 하드 잠금을 감지했습니다." - 머신에는 각각 18개의 코어를 가진 4개의 CPU가 있으므로 이것이 어느 것인지 알 수 없습니다.

고쳐 쓰다: "maxcpus=0" 커널 부팅 매개변수를 사용하여 결국 부팅되었지만 "LVM2 논리 볼륨을 활성화하기 위해 실행 중인 부팅 작업(Xmin xs/무제한)"이라는 메시지가 계속 표시되어 조사 중입니다. -하지만 CPU 하드웨어 문제일까요?

답변1

Emulex 카드 드라이버를 업그레이드한 후 커널에 더 이상 패닉이 발생하지 않습니다.

버전 11.0.270.24~11.4.1186.3

관련 정보