계획되지 않은 중단 진단

계획되지 않은 중단 진단

알 수 없는 이유로 서버가 종료되는 문제가 있습니다. 이런 일이 발생할 때마다 로그를 확인하지만 왜 실패했는지에 대해 특별히 흥미로운 내용을 찾을 수 없습니다.

문제를 진단하는 데 도움이 되도록 내가 무엇을 해야 하는지 제안할 수 있는 사람이 있습니까?

답변1

하드웨어 문제인 것 같습니다.

시스템에 뭔가를 추가했나요? RAM, 새로운 GPU, HDD, PCI 카드 등?

물리적:

  • 모든 케이블을 확인하십시오.
  • RAM 설치를 확인하세요.
  • 모든 PCI 설치를 확인하십시오.
  • CPU를 다시 설치합니다(다른 효과가 없는 경우).
  • 외부 및 내부 전원 코드를 확인하십시오.

[편집하다]:지적한대로@본브랜드
필요에 따라 냉각하고 청소하십시오.

그렇지 않은 경우 다음을 통해 상태를 확인하세요.lm_센서예를 들어 중요한 값 경고 시스템을 추가합니다. 여기에서 팬 상태와 전압도 확인할 수 있습니다. 전압이 표시되지 않으면 BIOS에서 이를 보고하는지 확인할 수 있습니다. 그런 다음 하드웨어의 파일을 확인하여 레벨이 올바른지 확인하십시오.아래의 전압계 확인을 참조하십시오.


BIOS를 업데이트하세요.

당신은 말한다:

[...] 왜 떨어졌는지에 대해 특별히 흥미로운 점을 찾을 수 없습니다.

그런데 다른 데이터는 없나요?

/var/log/messages
/var/log/debug
/var/log/kern.log
...

이는 시작 시 시스템에 문제가 있음을 나타냅니까?

당신은마이크 셀로그달리기(기계 점검 예외)? 설치되어 있지 않은 경우.

smartmontools를 사용하여 HDD SMART 데이터를 확인하세요. 메모리 테스트, 스트레스 테스트 등을 실행합니다.

dmesg테스트를 실행할 때 확인하세요.

다음과 같은 많은 부팅 가능 CD 중 하나를 사용하십시오.

적절하다고 생각되는 대로 테스트해 보세요.

서버인 경우 - 오프사이드 위치에 있는 경우 전원 콘센트를 사용하여 전화기를 충전하는 관리자가 있는지 확인하세요.


[편집 2]:전원 공급 장치 점검.
추가 지침은 PSU 점검에 대해서만 제공됩니다. 오프보드 검사는 좋은 일이 될 수 있습니다. 이 경우 ATX인 경우 지름길을 취하는 것을 기억해야 합니다.열려 있는, (보통 녹색), 접지 (보통 검은색)는 PSU를 무대로 가져옵니다.(여분의 전선, 클립 등을 지참하세요.)

그런 다음 전압계 커넥터 하나를 접지(검은색)에 연결하고 다른 하나를 유색 전압계 커넥터에 연결하여 측정을 수행할 수 있습니다. 그런 다음 ±5% 범위를 벗어난 양수 값이나 ±10% 범위를 벗어난 음수 값을 읽으면 일반적으로 문제가 발생합니다. (4.1.4 전압 허용 오차). 12V는 확인하기 가장 쉽고 11.40~12.60V 범위에 있어야 합니다. 일반적인 ATX에서는 다음과 같습니다.

* Yellow: +12  V;  value ⊆ { 11.40 , …,  12.60 }
* Red   : + 5  V;  value ⊆ {  4.75 , …,   5.50 }
* Orange: + 3.3V;  value ⊆ {  3.135, …,   3.465}
* Brown : + 3.3V;  value ⊆ {  3.135, …,   3.465}
* Blue  : -12  V;  value ⊆ {-13.2  , …, -10.8  }

PSU 공급업체의 설명서를 확인하거나보다 일반적인 사양그리고 마더보드 사양.


관련 정보