저는 nVIDIA 기반 개별 그래픽이 탑재된 Intel i5 3570K 시스템에서 GNU/Linux Mint 18.1 64비트를 사용하고 있습니다.
최근 집 근처에서 정전이 발생했습니다. 그 후, 컴퓨터를 부팅할 수 없었고 PSU를 교체해야 했습니다. 이제 내 컴퓨터가 부팅되고 작동합니다. 그러나 GPU 및 일부 USB 장치(연결이 끊어지지 않은)의 연결 끊김 및 다시 연결과 관련된 이상한 오류 메시지가 로그에 표시됩니다.
[ 167.367247] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 0, TPC 0): Out Of Range Address
[ 167.367254] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 0, TPC 0): Physical Multiple Warp Errors
[ 167.367260] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x504648=0x15000e 0x504650=0x24 0x504644=0x13eff2 0x50464c=0x7f
[ 167.367293] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 1, TPC 0): Out Of Range Address
[ 167.367296] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 1, TPC 0): Physical Multiple Warp Errors
[ 167.367298] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x50c648=0x3a000e 0x50c650=0x24 0x50c644=0x13eff2 0x50c64c=0x7f
[ 167.367329] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 2, TPC 0): Out Of Range Address
[ 167.367332] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 2, TPC 0): Physical Multiple Warp Errors
[ 167.367335] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x514648=0x1e000e 0x514650=0x24 0x514644=0x13eff2 0x51464c=0x7f
[ 167.367362] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ChID 0010, Class 0000a0c0, Offset 00001b0c, Data 00000000
[ 167.709832] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 167.709836] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 168.045998] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 168.046003] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 168.407864] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 168.407869] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 168.752045] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 168.752049] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 169.110574] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 169.110578] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 169.479404] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 169.479408] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 169.819896] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 169.819900] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[ 529.780140] usb 2-1.6: USB disconnect, device number 4
[ 530.008396] usb 2-1.6: new low-speed USB device number 7 using ehci-pci
[ 530.105253] usb 2-1.6: New USB device found, idVendor=045e, idProduct=0084
[ 530.105258] usb 2-1.6: New USB device strings: Mfr=1, Product=2, SerialNumber=0
[ 530.105260] usb 2-1.6: Product: Microsoft Basic Optical Mouse
[ 530.105263] usb 2-1.6: Manufacturer: Microsoft
[ 530.109030] input: Microsoft Microsoft Basic Optical Mouse as /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.6/2-1.6:1.0/0003:045E:0084.0003/input/input21
[ 530.109415] hid-generic 0003:045E:0084.0003: input,hidraw1: USB HID v1.11 Mouse [Microsoft Microsoft Basic Optical Mouse ] on usb-0000:00:1d.0-1.6/input0
[ 790.118073] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[ 790.118077] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.213339] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.308416] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.421164] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.521354] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.620486] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.712321] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[ 790.808216] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
시스템에 과도한 부하를 가하려고 할 때마다(예: 소스에서 소스 프로젝트를 빌드하는 등) 일반적으로 UI를 포함한 모든 것이 멈추거나 심각하게 지연됩니다. 과거에는 이런 일이 발생하지 않았습니다.
한편, 저는 최근에 apt-get upgrade
새로운 버전의 Linux 커널(사용자 지정 버전이 아닌 배포판에서 제공하는 버전)을 사용하고 있습니다.
내 질문은 다음과 같습니다
- 제가 보고 있는 것이 반드시 하드웨어 문제인가요?
- 그렇다면 무엇이 문제가 될 수 있습니까?
- 그렇지 않은 경우 운영 체제 또는 사용자 응용 프로그램의 어떤 부분이 책임을 질 수 있습니까?
답변1
이것은 오래된 질문일 수 있지만 비슷한 문제가 발생하는 경우 Nvidia 웹사이트에서 Xid 오류 메시지를 확인하는 것이 좋습니다.이 링크에서
예를 들어 오류 번호 13과 31은 사용자 응용 프로그램과 관련이 있음을 알 수 있습니다. 사용 중인 소프트웨어가 메모리 사용이나 액세스를 잘못 처리할 수 있습니다.