다음 오류로 인해 서버가 충돌한 것으로 나타났습니다. 결함이 있는 하드웨어와 관련이 있는지 아니면 완전히 관련이 있는지 확실하지 않습니다.
서버 세부 정보: Red Hat Enterprise Linux ES 버전 4(Nahant 업데이트 6) [root@athena log]# uname -a Linux athena.nsdecatur.local 2.6.9-67.0.7.ELsmp #1 SMP Wed Feb 27 04 :47: 23 EST 2008 x86_64 x86_64 x86_64 GNU/리눅스
정보
Sep 17 15:08:16 athena kernel: EDAC k8 MC0: general bus error: participating processor(local node response), time-out(no timeout) memory transaction type(generic read), mem or i/o(mem access), cache level(generic)
Sep 17 15:08:16 athena kernel: MC0: CE page 0x2c2766, offset 0xb10, grain 8, syndrome 0xac08, row 1, channel 0, label "": k8_edac
Sep 17 15:08:16 athena kernel: MC0: CE - no information available: k8_edac Error Overflow set
Sep 17 15:08:16 athena kernel: EDAC k8 MC0: extended error code: ECC chipkill x4 error
Sep 17 15:08:17 athena su(pam_unix)[19579]: session opened for user oracle by (uid=0)
Sep 17 15:08:17 athena su(pam_unix)[19579]: session closed for user oracle
Sep 17 15:08:17 athena su(pam_unix)[19634]: session opened for user oracle by (uid=0)
Sep 17 15:08:17 athena su(pam_unix)[19634]: session closed for user oracle
Sep 17 15:08:18 athena kernel: EDAC k8 MC0: general bus error: participating processor(local node origin), time-out(no timeout) memory transaction type(generic read), mem or i/o(mem access), cache level(generic)
Sep 17 15:08:18 athena kernel: MC0: CE page 0x39c857, offset 0xd50, grain 8, syndrome 0x1cc8, row 1, channel 0, label "": k8_edac
Sep 17 15:08:18 athena kernel: MC0: CE - no information available: k8_edac Error Overflow set
Sep 17 15:08:18 athena kernel: EDAC k8 MC0: extended error code: ECC chipkill x4 error
Sep 17 15:08:18 athena su(pam_unix)[19715]: session opened for user oracle by (uid=0)
Sep 17 15:08:18 athena su(pam_unix)[19715]: session closed for user oracle
Sep 17 15:08:18 athena su(pam_unix)[19758]: session opened for user oracle by (uid=0)
Sep 17 15:08:19 athena su(pam_unix)[19758]: session closed for user oracle
Sep 17 15:08:20 athena su(pam_unix)[19807]: session opened for user oracle by (uid=0)
Sep 17 15:08:20 athena su(pam_unix)[19807]: session closed for user oracle
Sep 17 15:08:20 athena su(pam_unix)[19850]: session opened for user oracle by (uid=0)
Sep 17 15:08:20 athena su(pam_unix)[19850]: session closed for user oracle
Sep 17 15:08:20 athena kernel: EDAC k8 MC0: general bus error: participating processor(local node origin), time-out(no timeout) memory transaction type(generic read), mem or i/o(mem access), cache level(generic)
Sep 17 15:08:20 athena kernel: MC0: CE page 0x39c857, offset 0xd50, grain 8, syndrome 0x1cc8, row 1, channel 0, label "": k8_edac
Sep 17 15:08:20 athena kernel: EDAC k8 MC0: extended error code: ECC chipkill x4 error
Sep 17 15:08:21 athena su(pam_unix)[19899]: session opened for user oracle by (uid=0)
Sep 17 15:08:21 athena kernel: EDAC k8 MC0: general bus error: participating processor(local node origin), time-out(no timeout) memory transaction type(generic read), mem or i/o(mem access), cache level(generic)
Sep 17 15:23:54 athena syslogd 1.4.1: restart.
Sep 17 15:23:54 athena syslog: syslogd startup succeeded
Sep 17 15:23:54 athena kernel: klogd 1.4.1, log source = /proc/kmsg started.
답변1
이러한 오류는 RAM이 ECC 이벤트를 감지했음을 의미합니다. RAM에 문제가 있습니다. 일반적으로 계속해서 더 많은 오류를 모니터링하게 되는데, 이는 일반적으로 RAM에 결함이 있거나 RAM 컨트롤러에 결함이 있음을 나타냅니다. 때때로 한두 개의 팝업이 나타나는 것은 드문 일이 아닙니다.
두 경우 모두 하드웨어 오류입니다.
감시 장치
이러한 오류를 모니터링하고 임계값을 설정하는 데 관심이 있다면 이 패키지를 확인해 보세요 mcelog
. 트리거 및 해당 효과에 대한 설정은 다음 제목의 U&L 질문에서 다룹니다.mcelog에 대한 쓰기 트리거.