Ubuntu 노트북의 하드 잠금을 어떻게 디버깅해야 합니까?

Ubuntu 노트북의 하드 잠금을 어떻게 디버깅해야 합니까?

저는 한동안 Thinkpad T450에서 Ubuntu를 실행해 왔습니다.

가끔씩 시스템이 나에게 하드 잠금을 제공합니다. 예를 들어 마우스가 움직이지 않고 ctrl-alt-f#을 누르면 일반 터미널로 이동하지 않습니다.

아직 매직 sysreq 키를 사용해보지 않았습니다. 다음에 시도해 보겠지만 낙관적이지는 않습니다.

다음은 당시 Journalctl의 일부입니다(이 문제를 해결할 수 있도록 영구 로깅을 활성화했습니다).

Jul 07 16:53:27 gothputer systemd[1]: Starting Cleanup of Temporary Directories...
Jul 07 16:53:27 gothputer systemd-tmpfiles[5215]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring.
Jul 07 16:53:27 gothputer systemd[1]: Started Cleanup of Temporary Directories.
Jul 07 16:55:13 gothputer kernel: perf interrupt took too long (5045 > 5000), lowering kernel.perf_event_max_sample_rate to 25000
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Timed out waiting for reply from 91.189.94.4:123 (ntp.ubuntu.com).
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Synchronized to time server 91.189.89.199:123 (ntp.ubuntu.com).
Jul 07 17:12:40 gothputer kernel: thinkpad_acpi: EC reports that Thermal Table has changed
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session opened for user root by (uid=0)
Jul 07 17:17:01 gothputer CRON[6045]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session closed for user root
Jul 07 17:25:13 gothputer wpa_supplicant[1206]: wlp3s0: WPA: Group rekeying completed with e0:3f:49:e2:3f:c4 [GTK=CCMP]
Jul 07 17:41:35 gothputer sudo[7819]: pam_ecryptfs: pam_sm_authenticate: /home/zee is already mounted
Jul 07 17:41:35 gothputer sudo[7819]:      zee : TTY=pts/1 ; PWD=/home/zee/Downloads ; USER=root ; COMMAND=/usr/bin/gdebi N1.deb
Jul 07 17:41:35 gothputer sudo[7819]: pam_unix(sudo:session): session opened for user root by zee(uid=0)
Jul 07 17:41:43 gothputer sudo[7819]: pam_unix(sudo:session): session closed for user root
-- Reboot --
Jul 07 17:48:21 gothputer systemd-journald[313]: Runtime journal (/run/log/journal/) is 8.0M, max 118.9M, 110.9M free.
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuset
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpu
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuacct
Jul 07 17:48:21 gothputer kernel: Linux version 4.4.0-28-generic (buildd@lcy01-13) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2.1) ) #47-Ubuntu SMP Fri Jun 24 10:09:13 UTC 2016 (Ubuntu
Jul 07 17:48:21 gothputer kernel: Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-28-generic.efi.signed root=UUID=3862c22d-6f33-42a1-8bde-d05dc9f1af16 ro quiet splash vt.handoff=7
Jul 07 17:48:21 gothputer kernel: KERNEL supported cpus:
Jul 07 17:48:21 gothputer kernel:   Intel GenuineIntel
Jul 07 17:48:21 gothputer kernel:   AMD AuthenticAMD
Jul 07 17:48:21 gothputer kernel:   Centaur CentaurHauls
Jul 07 17:48:21 gothputer kernel: x86/fpu: xstate_offset[2]:  576, xstate_sizes[2]:  256
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.

이 특정 잠금 기간 동안 내 데스크탑의 시계는 참고로 17:47:40에 고정되었습니다.

다음 단계는 무엇입니까? 찾을 수 있는 모든 로그를 읽는 것 외에는 "무엇"이 실패하는지 명확하지 않기 때문에 어디서부터 시작해야 할지 잘 모르겠습니다.

답변1

폐쇄에 대한 뚜렷한 이유가 없을 때 시도할 사항

  • CPU의 최대 작동 온도가 얼마인지 제조업체에 문의하십시오.
  • BIOS 또는 온보드 진단(사용 가능한 경우)이 오류(전압, 팬 속도, 온도, 스마트 오류)를 감지하는지 확인하십시오.
  • sudo service lightdm stop그래픽 등을 제외하고 콘솔 오류 메시지를 보려면 X(이와 유사한 것)를 끄십시오.
  • lm-sensors패키지를 설치 하고 구성합니다. 거기에서도 모든 것이 괜찮아요
  • 다음과 같이 센서를 계속 작동시키세요.watch -n1 sensors
  • 출력 에 주의를 기울이십시오 dmesg. 커널에 대한 모든 것을 알려줄 것입니다.
  • ALT-F1(F2,F3) 스위치 화면
  • 애플리케이션 내에서 CPU 버너나 기타 프로그램을 실행하여 stressCPU와 출력을 가열하세요 sensors. CPU의 모든 코어를 사용하는지 확인하십시오.
  • smartctl을 설치 smartmontools및 실행하여 하드 드라이브를 쿼리하고 자체 테스트를 수행합니다.
  • memtest86RAM을 확인하려면 다른 실행 가능한 응용 프로그램을 사용해 보십시오 . 아니면 memtesterLinux 내에서 시도 해야 하는 경우
  • 한번 시도해 보거나 bonnie++하드 dd드라이브에 스트레스를 가해 보세요.

이 모든 일이 잘 진행되고 있는 것 같다면 X, 특히 그래픽 하드웨어나 드라이버(과거 경험에 근거하여)를 의심하게 될 것입니다. Nvidia 드라이버를 사용하는 경우 제공된 GUI 유틸리티에서 온도와 팬 속도를 볼 수 있다는 것을 알고 있습니다.

관련 정보