Linux 시스템이 매일 충돌합니다. 이 커널 스택 추적은 무엇을 의미합니까?

Linux 시스템이 매일 충돌합니다. 이 커널 스택 추적은 무엇을 의미합니까?

충돌은 완전한 정지 형태로 발생합니다. 더 이상 컨트롤이 없으며 화면이 정지됩니다.

다음을 사용하여 이 컴퓨터에서 스택 추적을 얻었습니다.

sudo journalctl -f

표시되는 마지막 메시지는 다음과 같습니다.

Nov 18 19:42:12  kernel: Bad mode in Error handler detected, code 0xbf000002 -- SError
Nov 18 19:42:12  kernel: Internal error: Oops - bad mode: 0 [#3] SMP
Nov 18 19:42:12  kernel: Modules linked in: algif_hash algif_skcipher af_alg btrfs xor raid6_pq 8188fu joydev bcmdhd uio_pdrv_genirq uio binfmt_misc sch_fq_codel bnep ip_tables x_tables
Nov 18 19:42:12  kernel: CPU: 3 PID: 3469 Comm: smbd Tainted: G      D W       4.4.179 #1
Nov 18 19:42:12  kernel: Hardware name: FriendlyElec NanoPi M4 (DT)
Nov 18 19:42:12  kernel: task: ffffffc0aedcd400 task.stack: ffffffc047ee8000
Nov 18 19:42:12  kernel: PC is at 0x7f78af9dfc
Nov 18 19:42:12  kernel: LR is at 0x7f78af9dd8
Nov 18 19:42:12  kernel: pc : [<0000007f78af9dfc>] lr : [<0000007f78af9dd8>] pstate: 80000000
Nov 18 19:42:12  kernel: sp : 0000007f6fbbe370
Nov 18 19:42:12  kernel: x29: 0000007f6fbbe370 x28: 00000055aa9fa870 
Nov 18 19:42:12  kernel: x27: 0000007f78afc640 x26: 0000000000000000 
Nov 18 19:42:12  kernel: x25: 00000055aa9fa898 x24: 0000007f6fbbe4e8 
Nov 18 19:42:12  kernel: x23: 0000000000000000 
Nov 18 19:42:12  kernel: Bad mode in Error handler detected, code 0xbf000002 -- SError
Nov 18 19:42:12  kernel: x22: 0000000000000000 
Nov 18 19:42:12  kernel: 
Nov 18 19:42:12  kernel: x21: 00000055aa9fa898 x20: 0000000000000000 
Nov 18 19:42:12  kernel: x19: 0000000000000189 x18: 0000000000000001 
Nov 18 19:42:12  kernel: x17: 0000000000000002 x16: 0000000000000002 
Nov 18 19:42:12  kernel: x15: 0000000000000000 x14: 002ffa52590473c3 
Nov 18 19:42:12  kernel: x13: 0000000063784283 x12: 0000000000000018 
Nov 18 19:42:12  kernel: x11: 000000003006b4dc x10: 0000000063784283 
Nov 18 19:42:12  kernel: x9 : 003b9aca00000000 x8 : 0000000000000062 
Nov 18 19:42:12  kernel: x7 : 0000007f6fbbe448 x6 : 0000000000000000 
Nov 18 19:42:12  kernel: x5 : 00000000ffffffff x4 : 0000000000000000 
Nov 18 19:42:12  kernel: x3 : 0000007f6fbbe4e8 x2 : 0000000000000000 
Nov 18 19:42:12  kernel: x1 : 0000000000000189 x0 : 0000000000000000 
Nov 18 19:42:12  kernel: 
Nov 18 19:42:12  kernel: Process smbd (pid: 3469, stack limit = 0xffffffc047ee8000)
Nov 18 19:42:12  kernel: ---[ end trace 5fba866947145e9b ]---
Nov 18 19:42:12  kernel: Bad mode in Error handler detected, code 0xbf000002 -- SError
Nov 18 19:42:12  kernel: Internal error: Oops - bad mode: 0 [#4] SMP
Nov 18 19:42:12  kernel: Modules linked in: algif_hash algif_skcipher af_alg btrfs xor raid6_pq 8188fu joydev bcmdhd uio_pdrv_genirq uio binfmt_misc sch_fq_codel bnep ip_tables x_tables
Nov 18 19:42:12  kernel: CPU: 5 PID: 3471 Comm: smbd Tainted: G      D W       4.4.179 #1
Nov 18 19:42:12  kernel: Hardware name: FriendlyElec NanoPi M4 (DT)
Nov 18 19:42:12  kernel: task: ffffffc0b72c8000 task.stack: ffffffc047d40000
Nov 18 19:42:12  kernel: PC is at 0x7f78af9dfc
Nov 18 19:42:12  kernel: LR is at 0x7f78af9dd8
Nov 18 19:42:12  kernel: pc : [<0000007f78af9dfc>] lr : [<0000007f78af9dd8>] pstate: 80000000
Nov 18 19:42:12  kernel: sp : 0000007f7240e370
Nov 18 19:42:12  kernel: x29: 0000007f7240e370 x28: 00000055aa9fa870 
Nov 18 19:42:12  kernel: x27: 0000007f78afc640 x26: 0000000000000000 
Nov 18 19:42:12  kernel: x25: 00000055aa9fa898 x24: 0000007f7240e4e8 
Nov 18 19:42:12  kernel: x23: 0000000000000000 x22: 0000000000000000 
Nov 18 19:42:12  kernel: x21: 00000055aa9fa898 x20: 0000000000000000 
Nov 18 19:42:12  kernel: x19: 0000000000000189 x18: 0000000000000000 
Nov 18 19:42:12  kernel: x17: 0000000000000004 x16: 0000000000000002 
Nov 18 19:42:12  kernel: x15: 0000000000000000 x14: 00302818e1b6bcc3 
Nov 18 19:42:12  kernel: x13: 0000000063784283 x12: 0000000000000018 
Nov 18 19:42:12  kernel: x11: 0000000030366a81 x10: 0000000063784283 
Nov 18 19:42:12  kernel: x9 : 003b9aca00000000 x8 : 0000000000000062 
Nov 18 19:42:12  kernel: x7 : 0000007f7240e448 x6 : 0000000000000000 
Nov 18 19:42:12  kernel: x5 : 00000000ffffffff x4 : 0000000000000000 
Nov 18 19:42:12  kernel: x3 : 0000007f7240e4e8 x2 : 0000000000000000 
Nov 18 19:42:12  kernel: x1 : 0000000000000189 x0 : 0000000000000000 
Nov 18 19:42:12  kernel: 
Nov 18 19:42:12  kernel: Process smbd (pid: 3471, stack limit = 0xffffffc047d40000)
Nov 18 19:42:12  kernel: ---[ end trace 5fba866947145e9c ]---
Nov 18 19:42:12  kernel: Internal error: Oops - bad mode: 0 [#5] SMP

이는 NVME 드라이브에 과도하게 액세스할 때 발생하는 것으로 보이지만 이는 단지 문제와 관련이 있을 수 있습니다. hdparm을 사용하고 많은 드라이브 기능을 끄려고 시도했지만 오류가 지속됩니다.

또한 CPU의 클럭 속도를 변경하고 전원 공급 장치를 변경해 보았습니다. 이것들은 효과가 거의 없습니다

답변1

좋아, Artem의 의견을 본 후 커널을 업그레이드해 보았습니다. 그러나 어떤 이유로 내 파이가 GRUB으로 부팅하는 것을 허용하지 않아서 부팅 복구를 실행했습니다. 이 작업에 시간을 보냈지만 시동 복구에서 디스크 공간이 부족하다고 계속 불평합니다.

30MB의 여유 공간이 있었는데, 내 물건을 분할하는 방식이 형편없어서 작업할 공간이 많지 않았지만, 700MB의 여유 공간을 더 확보할 수 있었고 그 이후로 충돌이 사라졌습니다.

결국 이것은 NVME 드라이버인 것으로 밝혀졌습니다. 대신 USB를 사용하여 문제를 해결했습니다.

관련 정보