최근 에서 Centos 6.4
까지 Centos 6.5
. 재부팅할 때마다 시스템 Dell T410 Tower
은 포스트를 통해 실행되어 IPv4 설정을 전달한 후 다음을 알립니다.
PCIe Training Error: Slot 1
system halted
여기에서 시작 하면 ctrl+alt+del
동일한 오류가 발생합니다(매번 확인).
Dell ESM 로그에 다음이 표시됩니다: 비디오 이후 일반 오류.
전원 버튼을 누른 다음 전원을 다시 켜면 시스템이 예상대로 부팅됩니다.
슬롯 1에는 시스템이 사용하는 네트워크 카드가 있습니다. (Centos 6.4를 처음 설치한 후 온보드 Broadcom 네트워크 카드에서 속도 및 대기 시간 문제가 발생하여 드라이버로 해결하려고 시도했지만 성공하지 못하여 Realtek을 사용하여 다른 네트워크 카드를 추가했는데 문제 없이 잘 작동했습니다. 6.5 업데이트까지)
나는 여전히 Linux 초보이고 다음 화면까지 커널이 로드되기 시작하지 않을 것이라고 생각하기 때문에 이것이 커널과 관련이 있다고 가정하지 않습니다. 이런 관점에서 보면 그래야 할 것 같습니다 kernel
.
2.6.32-431.5.1.el6.x86_64
동일한 문제가 있었고 2.6.32-431.11.2.el6.x86_64
다운그레이드로 인해 사라진 추가 CIFS 마운트 문제가 있었기 때문에 지금 실행하고 있습니다 .
uname -r
2.6.32-431.5.1.el6.x86_64
rpm -qa kernel
kernel-2.6.32-358.23.2.el6.x86_64
kernel-2.6.32-431.5.1.el6.x86_64
kernel-2.6.32-358.el6.x86_64
kernel-2.6.32-431.11.2.el6.x86_64
kernel-2.6.32-358.14.1.el6.x86_64
재부팅해도 동일한 결과가 나타나는지 확인하기 위해 6.4 커널로 더 돌아가는 것을 고려하고 있습니다. 커널을 이전 버전(6.5 -> 6.4)으로 되돌리려고 하면 어떤 다른 문제가 발생할 수 있는지, 그렇게 하지 말아야 할 다른 이유가 있는지 잘 모르겠습니다. 일시 중지 메시지 이후에 계속할 수 있는 옵션이 BIOS(어딘가)에 있을 수 있다고 생각했는데... 그렇게 하고 오류가 발생하면 네트워크 카드가 제대로 작동하지 않는 것 같습니다.
서버는 네트워크에 있는 대부분의 데스크탑에 대한 프록시 역할을 하므로 전원을 끄고 이론을 테스트할 시간이 제한되어 있습니다. 이제 시스템이 제대로 실행되는 것 같습니다. 수동으로 재부팅하지 않는 한 현재 상태에서는 괜찮은 것 같지만 도대체 무슨 일이 일어나고 있는지 궁금합니다.
dmesg
단편:
udev: starting version 147
EDAC MC: Ver: 2.1.0 Feb 12 2014
bnx2: Broadcom NetXtreme II Gigabit Ethernet Driver bnx2 v2.2.3 (June 27, 2012)
alloc irq_desc for 36 on node -1
alloc kstat_irqs on node -1
bnx2 0000:01:00.0: PCI INT A -> GSI 36 (level, low) -> IRQ 36
bnx2 0000:01:00.0: setting latency timer to 64
bnx2 0000:01:00.0: firmware: requesting bnx2/bnx2-mips-09-6.2.1b.fw
bnx2 0000:01:00.0: firmware: requesting bnx2/bnx2-rv2p-09-6.0.17.fw
bnx2 0000:01:00.0: eth0: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem da000000, IRQ 36, node addr a4:ba:db:12:39:24
alloc irq_desc for 48 on node -1
alloc kstat_irqs on node -1
bnx2 0000:01:00.1: PCI INT B -> GSI 48 (level, low) -> IRQ 48
bnx2 0000:01:00.1: setting latency timer to 64
bnx2 0000:01:00.1: firmware: requesting bnx2/bnx2-mips-09-6.2.1b.fw
bnx2 0000:01:00.1: firmware: requesting bnx2/bnx2-rv2p-09-6.0.17.fw
bnx2 0000:01:00.1: eth1: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem dc000000, IRQ 48, node addr a4:ba:db:12:39:25
r8169 Gigabit Ethernet driver 2.3LK-NAPI loaded
alloc irq_desc for 41 on node -1
alloc kstat_irqs on node -1
r8169 0000:02:00.0: PCI INT A -> GSI 41 (level, low) -> IRQ 41
r8169 0000:02:00.0: setting latency timer to 64
alloc irq_desc for 62 on node -1
alloc kstat_irqs on node -1
r8169 0000:02:00.0: irq 62 for MSI/MSI-X
r8169 0000:02:00.0: eth2: RTL8168c/8111c at 0xffffc90000c76000, 00:e0:4d:1a:12:76, XID 1c2000c0 IRQ 62
r8169 0000:02:00.0: eth2: jumbo features [frames: 6128 bytes, tx checksumming: ko]
ACPI Error: No handler for Region [IPMI] (ffff8801ad4ec420) [IPMI] (20090903/evregion-319)
ACPI Error: Region IPMI(7) has no handler (20090903/exfldio-295)
ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._GHL] (Node ffff8801ad4eb4c0), AE_NOT_EXIST
ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMC] (Node ffff8801ad4eb560), AE_NOT_EXIST
ACPI Exception: AE_NOT_EXIST, Evaluating _PMC (20090903/power_meter-759)
답변1
시스템이 있는 슬롯에 결함이 있거나 재부팅 후 네트워크 카드 자체에 문제가 있는 것 같습니다. 마더보드에서 전원이 제거되고 전원 버튼을 활성화하여 재부팅하면 카드 상태가 지워지고 이 상태에서 정상적으로 부팅할 수 있습니다.
믿거나 말거나, 과거에도 하드웨어가 "핫" 상태를 종료할 수 없었지만 콜드 상태에서는 부팅할 수 있었던 비슷한 문제를 본 적이 있습니다.
어쨌든 하드웨어를 곧 교체하고 싶습니다.
편집 #1
전체를 보면서Dell PowerEdge T410 사용 설명서이 섹션에서는 다양한 오류 메시지와 해결 방법에 대한 제안 사항을 표시합니다.
50페이지에서 발췌
이 표에 따르면 내 권장 사항과 일치하는 것 같습니다. 시스템 전원을 끄고 첫 번째 슬롯의 네트워크 카드를 재설정한 후 오류/문제가 사라지는지 확인합니다. 그렇지 않은 경우 NIC에 결함이 있거나 마더보드의 슬롯 #1에 결함이 있을 수 있습니다.