빈번한 분할 오류로 인해 브라우저 및/또는 시스템이 정지됩니다.

빈번한 분할 오류로 인해 브라우저 및/또는 시스템이 정지됩니다.

나는 한동안 새로 만든 컴퓨터에 몇 가지 문제를 겪었습니다. 저는 Pop!_OS를 선택하기로 결정했습니다(전용 Pop!_OS 포럼을 보지 못해서 여기에 왔습니다). Pop!_OS는 많은 엔지니어링 및 데이터 과학 관련 소프트웨어를 지원해야 하기 때문입니다. 이 컴퓨터에는 AMD® Ryzen 9 7900x 12코어 프로세서 × 24 및 NVIDIA GeForce RTX 3060 그래픽 카드가 장착되어 있습니다.

지금까지 저는 /var/log/kern.log백그라운드에서 모니터링해 왔으며 브라우저나 프로그램이 충돌할 때마다 아마도 일부 분할 오류와 관련이 있는 것으로 나타났습니다.

다음은 프로그램을 중지시키는 요인에 대한 대략적인 목록입니다.

chrome[9700]: segfault at 2d9b0303031a ip 000056081a8321db sp 00007ffcb1ad3580 error 4 in chrome[56081916f000+a492000] likely on CPU 17 (core 5, socket 0)

ThreadPoolForeg[12433]: segfault at 43168001 ip 000056081ff5485d sp 00007f73631fbba0 error 4 in chrome[56081916f000+a492000] likely on CPU 20 (core 10, socket 0)

gnome-shell[3019]: segfault at e641f8bf ip 00007f297b1f66d8 sp 00007ffe52033c60 error 6 in libmutter-clutter-10.so.0.0.0[7f297b1e0000+91000] likely on CPU 11 (core 13, socket 0)

Isolated Web Co[5349]: segfault at 8 ip 00007f79f7e1e861 sp 00007ffce6a71a10 error 4 in libxul.so[7f79f40be000+5e78000] likely on CPU 22 (core 12, socket 0)

VirtualBoxVM[5863]: segfault at 10 ip 00007f8cfe6a3b41 sp 00007ffc0591a670 error 6 in libc.so.6[7f8cfe692000+12b000] likely on CPU 19 (core 9, socket 0)

ibus-daemon[3165]: segfault at 20c4 ip 00007f7b14f6269d sp 00007ffc3272dee0 error 4 in libgobject-2.0.so.0.7200.4[7f7b14f48000+33000] likely on CPU 19 (core 9, socket 0)

저는 웹서핑이나 화상통화를 할 때 고립된 네트워크 장애를 가장 자주 경험합니다.

어디서부터 시작해야 할지, 문제의 범위를 좁힐 방법을 잘 모르겠습니다. 세그폴트가 계속해서 발생하기 때문에 먼저 세그폴트의 원인을 파악하는 데 집중해야 할 것 같습니다. 어떤 조언이나 지시라도 도움이 될 것입니다.


고쳐 쓰다

나는 sudo journalctl -b 0최신 출시를 조사하고 확인했으며 내가 생각하는 모든 오류를 제거했습니다.

Oct 05 08:31:32 pop-os kernel: ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.GPP7.UP00.DP40.UP00.DP68], AE_NOT_FOUND (20230331/dswload2-162)
Oct 05 08:31:32 pop-os kernel: ACPI Error: AE_NOT_FOUND, During name lookup/catalog (20230331/psobject-220)

Oct 05 08:31:32 pop-os kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)

Oct 05 08:31:33 pop-os /usr/bin/nvidia-powerd[1202]: No matching GPU found
Oct 05 08:31:33 pop-os /usr/bin/nvidia-powerd[1202]: Failed to initialize RM Client
Oct 05 08:31:33 pop-os systemd[1]: nvidia-powerd.service: Main process exited, code=exited, status=1/FAILURE
Oct 05 08:31:33 pop-os systemd[1]: nvidia-powerd.service: Failed with result 'exit-code'.
Oct 05 08:31:33 pop-os systemd[1]: Failed to start nvidia-powerd service.

Oct 05 08:31:34 pop-os vboxdrv.sh[1979]: failed: Look at /var/log/vbox-setup.log to find out what went wrong.
Oct 05 08:31:34 pop-os systemd[1]: vboxdrv.service: Control process exited, code=exited, status=1/FAILURE
Oct 05 08:31:34 pop-os systemd[1]: vboxdrv.service: Failed with result 'exit-code'.
Oct 05 08:31:34 pop-os systemd[1]: Failed to start VirtualBox Linux kernel module.

Oct 05 08:31:35 pop-os gnome-session[2074]: gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed
Oct 05 08:31:35 pop-os gnome-session[2074]: gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed
Oct 05 08:31:35 pop-os gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed

Oct 05 08:31:37 pop-os wpa_supplicant[1247]: bgscan simple: Failed to enable signal strength monitoring

Oct 05 08:40:40 pop-os systemd[3353]: app-gnome-gnome\x2dkeyring\x2dssh-3591.scope: Failed to add PIDs to scope's control group: No such process
Oct 05 08:40:40 pop-os systemd[3353]: app-gnome-gnome\x2dkeyring\x2dssh-3591.scope: Failed with result 'resources'.
Oct 05 08:40:40 pop-os systemd[3353]: Failed to start Application launched by gnome-session-binary.

Oct 05 08:40:42 pop-os gnome-shell[3601]: GNOME Shell started at Thu Oct 05 2023 08:40:41 GMT-0400 (EDT)
Oct 05 08:40:42 pop-os gnome-shell[3601]: Registering session with GDM
Oct 05 08:40:42 pop-os gsd-sharing[2148]: Error releasing name org.gnome.SettingsDaemon.Sharing: The connection is closed
Oct 05 08:40:42 pop-os gsd-rfkill[2159]: Error releasing name org.gnome.SettingsDaemon.Rfkill: The connection is closed
Oct 05 08:40:42 pop-os gnome-session-binary[2074]: GLib-CRITICAL: g_hash_table_foreach_remove_or_steal: assertion 'version == hash_table->version' failed

새로 부팅한 후 몇 가지 다른 점을 발견했습니다.

Oct 05 22:22:49 pop-os kernel: FAT-fs (nvme0n1p1): Volume was not properly unmounted. Some data may be corrupt. Please run fsck.
Oct 05 22:22:49 pop-os kernel: FAT-fs (nvme0n1p2): Volume was not properly unmounted. Some data may be corrupt. Please run fsck.

Oct 05 22:22:49 pop-os kernel: nvidia: module license 'NVIDIA' taints kernel.
Oct 05 22:22:49 pop-os kernel: Disabling lock debugging due to kernel taint
Oct 05 22:22:49 pop-os kernel: nvidia: module license taints kernel.


업데이트 - Memtest86 실패

글쎄요, 저는 Memtest86 테스트 스위트를 성공적으로 실행했고 결함을 발견했습니다. 실제로는 하드웨어 문제인 것 같습니다.

여기에 이미지 설명을 입력하세요.

Memtest86은 하드웨어 문제가 있는지 식별할 수 있지만 어떤 장치에 결함이 있는지는 식별할 수 없는 것 같습니다. RAM 스틱 중 하나 또는 둘 모두에 문제가 있는 것 같습니다.

MemTest86이 내 메모리에서 오류를 감지했습니다. 내 기억에 뭔가 문제가 있는 걸까요?

MemTest86에서 보고된 모든 오류가 메모리 오류로 인한 것은 아닙니다. 이 테스트는 CPU, L1 및 L2 캐시, 마더보드를 암시적으로 테스트합니다. 테스트를 수행하면 오류가 발생한 원인을 파악하는 것이 불가능합니다. 그러나 대부분의 오류는 메모리 모듈 문제로 인해 발생합니다. 그렇지 않은 경우 유일한 옵션은 결함이 수정될 때까지 부품을 교체하는 것입니다.

모든 분들의 의견에 감사드립니다. 이 시점에서 한 번에 하나의 RAM 스틱을 삽입하여 Memtest를 다시 실행해야 할까요? 또한 CPU를 테스트하는 데 사용할 수 있는 유사한 도구가 있습니까?

드디어 이 컴퓨터를 구입한지 몇 달이 되지 않았습니다. 결함이 있는 하드웨어를 식별할 수 있으면 OEM에게 이를 교체하도록 요청할 수 있습니까? 아니면 그냥 운이 없는 것입니까?

관련 정보