시스템 지연/정지, dmesg에 GPU 오류 및 가짜 USB 연결 끊김이 표시됩니다. 어떻게 해야 합니까?

시스템 지연/정지, dmesg에 GPU 오류 및 가짜 USB 연결 끊김이 표시됩니다. 어떻게 해야 합니까?

저는 nVIDIA 기반 개별 그래픽이 탑재된 Intel i5 3570K 시스템에서 GNU/Linux Mint 18.1 64비트를 사용하고 있습니다.

최근 집 근처에서 정전이 발생했습니다. 그 후, 컴퓨터를 부팅할 수 없었고 PSU를 교체해야 했습니다. 이제 내 컴퓨터가 부팅되고 작동합니다. 그러나 GPU 및 일부 USB 장치(연결이 끊어지지 않은)의 연결 끊김 및 다시 연결과 관련된 이상한 오류 메시지가 로그에 표시됩니다.

[  167.367247] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 0, TPC 0): Out Of Range Address
[  167.367254] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 0, TPC 0): Physical Multiple Warp Errors
[  167.367260] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x504648=0x15000e 0x504650=0x24 0x504644=0x13eff2 0x50464c=0x7f
[  167.367293] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 1, TPC 0): Out Of Range Address
[  167.367296] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 1, TPC 0): Physical Multiple Warp Errors
[  167.367298] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x50c648=0x3a000e 0x50c650=0x24 0x50c644=0x13eff2 0x50c64c=0x7f
[  167.367329] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Warp Exception on (GPC 2, TPC 0): Out Of Range Address
[  167.367332] NVRM: Xid (PCI:0000:02:00): 13, Graphics SM Global Exception on (GPC 2, TPC 0): Physical Multiple Warp Errors
[  167.367335] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ESR 0x514648=0x1e000e 0x514650=0x24 0x514644=0x13eff2 0x51464c=0x7f
[  167.367362] NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ChID 0010, Class 0000a0c0, Offset 00001b0c, Data 00000000
[  167.709832] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  167.709836] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  168.045998] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  168.046003] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  168.407864] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  168.407869] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  168.752045] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  168.752049] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  169.110574] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  169.110578] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  169.479404] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  169.479408] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  169.819896] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  169.819900] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000010, engmask 00000111, intr 10000000
[  529.780140] usb 2-1.6: USB disconnect, device number 4
[  530.008396] usb 2-1.6: new low-speed USB device number 7 using ehci-pci
[  530.105253] usb 2-1.6: New USB device found, idVendor=045e, idProduct=0084
[  530.105258] usb 2-1.6: New USB device strings: Mfr=1, Product=2, SerialNumber=0
[  530.105260] usb 2-1.6: Product: Microsoft Basic Optical Mouse 
[  530.105263] usb 2-1.6: Manufacturer: Microsoft 
[  530.109030] input: Microsoft  Microsoft Basic Optical Mouse  as /devices/pci0000:00/0000:00:1d.0/usb2/2-1/2-1.6/2-1.6:1.0/0003:045E:0084.0003/input/input21
[  530.109415] hid-generic 0003:045E:0084.0003: input,hidraw1: USB HID v1.11 Mouse [Microsoft  Microsoft Basic Optical Mouse ] on usb-0000:00:1d.0-1.6/input0
[  790.118073] NVRM: GPU at PCI:0000:02:00: GPU-a503e5ff-3740-8318-878a-a21e528c646c
[  790.118077] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.213339] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.308416] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.421164] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.521354] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.620486] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.712321] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000
[  790.808216] NVRM: Xid (PCI:0000:02:00): 31, Ch 00000018, engmask 00000101, intr 10000000

시스템에 과도한 부하를 가하려고 할 때마다(예: 소스에서 소스 프로젝트를 빌드하는 등) 일반적으로 UI를 포함한 모든 것이 멈추거나 심각하게 지연됩니다. 과거에는 이런 일이 발생하지 않았습니다.

한편, 저는 최근에 apt-get upgrade새로운 버전의 Linux 커널(사용자 지정 버전이 아닌 배포판에서 제공하는 버전)을 사용하고 있습니다.

내 질문은 다음과 같습니다

  • 제가 보고 있는 것이 반드시 하드웨어 문제인가요?
  • 그렇다면 무엇이 문제가 될 수 있습니까?
  • 그렇지 않은 경우 운영 체제 또는 사용자 응용 프로그램의 어떤 부분이 책임을 질 수 있습니까?

답변1

이것은 오래된 질문일 수 있지만 비슷한 문제가 발생하는 경우 Nvidia 웹사이트에서 Xid 오류 메시지를 확인하는 것이 좋습니다.이 링크에서

예를 들어 오류 번호 13과 31은 사용자 응용 프로그램과 관련이 있음을 알 수 있습니다. 사용 중인 소프트웨어가 메모리 사용이나 액세스를 잘못 처리할 수 있습니다.

관련 정보