서버를 재부팅하여 memtest(예: 1~2회)를 실행한 다음 Linux로 다시 재부팅하고 일부 로그에 보고서를 기록하는 방법이 있습니까?
Windows Server 2012의 이 기능은 원격 서버의 RAM 오류를 진단하는 데 여러 번 도움이 되었지만 Linux 서버에 대한 방법은 Google에서 찾을 수 없습니다.
답변1
하나 있다커널 명령줄 매개변수전체 메모리를 테스트하고 부팅 순서의 일부로 불량 블록을 잠급니다. 이것은~ 할 것이다상자가 응답하지 않는 것처럼 보이도록 시작 순서에 몇 분을 추가합니다.
memtest= [KNL,X86,ARM,M68K,PPC,RISCV] Enable memtest Format: <integer> default : 0 <disable> Specifies the number of memtest passes to be performed. Each pass selects another test pattern from a given set of patterns. Memtest fills the memory with this pattern, validates memory contents and reserves bad memory regions that are detected.
불량 블록이 어디에 있는지 알고 나면 badram=
매개변수를 사용하여 Linux 커널에 불량 블록이 있는 경우 이를 방지할 수 있습니다.나쁜 기억수리하다. 당신은 또한 볼 수 있습니다MemTest86+ 오류 표시를 기반으로 올바른 불량 RAM 섹터를 블랙리스트에 추가하는 방법은 무엇입니까?
게다가온라인사용자 공간 메모리 테스터 -메모리 테스터, IPMI로 바로 이동할 수도 있습니다. (반쯤 괜찮은 서버의 불량 RAM에 플래그를 지정해야 합니다. Intel 서버에서는 IPMI에서 발견한 ECC 오류가 syslog에 기록됩니다.)