응, 나도 이 질문에 대해 알아가지다 계속 ~ 이다 묻다 십 만약에 아니요 수백 ~의 이류 앞으로. 그래도 비슷한 질문을 모두 살펴보고 거기에 나열된 모든 것을 시도했지만 소용이 없었습니다.
Ubuntu 21.04( )를 실행하는 Raspberry Pi 4 모델 B에서 일부 코드를 컴파일한 후 Linux rpi4 5.11.0-1017-raspi #18-Ubuntu SMP PREEMPT Mon Aug 23 07:34:31 UTC 2021 aarch64 aarch64 aarch64 GNU/Linux
ccache가 멈추고 거의 한 시간 동안 100% CPU에서 실행되었습니다. ps -l
문제의 프로세스의 출력 은 다음과 같습니다 .
$ ps -l -p 7580
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
1 R 1000 7580 1 99 80 0 - 1725 - pts/2 00:54:10 ccache
나는 kill
그것을 하려고 노력한다 kill -9
. 효과가 없습니다. 좀비가 아니라 좀비처럼 보입니다. 실행 중:
$ sudo cat /proc/7580/syscall
running
strace
나는 그것을 사용하고 추가하려고 시도했지만 gdb
둘 다 중단되었습니다.
나는 상위 프로세스(그림 참조 ps auxf
)를 찾고 모든 상위 프로세스를 종료한 다음 문제가 되는 프로세스를 다시 종료해 보았습니다. 작동하지 않습니다.
나는 그 과정을 시작할 때까지 달리고 demsg
, 살펴보고 /var/log/syslog
, 어깨 너머로 살펴보았습니다. 디버깅하는 데 도움이 되는 단서를 찾지 못했습니다.
일반적으로 재부팅하고 계속 생활하지만 이번이 하루에 세 번째 재부팅이므로(ccache로 인해 두 번, cpuUsage.sh
VS Code 원격 설치를 호출하는 셸 스크립트로 인해 한 번) 이것이 표준이 될 것으로 의심됩니다. 앞으로. 나는 이 보드를 몇 달 동안 사용해 왔지만 오늘까지 이런 일이 일어난 적이 없습니다.
나의 유일한 합리적이지만 확인되지 않은 가정은 마더보드 부팅 SD 카드가 불량일 수 있다는 것인데, 이를 진단하는 방법을 모르겠습니다.
이 프로세스를 종료하는 마법 명령을 알고 싶지만 지금까지 시도한 모든 것을 고려할 때 그런 것이 존재하지 않는다고 확신합니다. 내 질문은: 이런 일이 계속 발생한다고 가정하면 어떻게 진단합니까? 하루에 여러 번 보드를 다시 시작하는 것은 분명히 지속 불가능하며 지금부터 그렇게 해야 할 수도 있다고 생각합니다.
편집하다: 의견에서 제안한 대로 dmesg
출력을 볼 때 다음을 시도했습니다.
$ sudo dd if=/dev/mmcblk0p2 of=/dev/null bs=1M
60648+1 records in
60648+1 records out
63595068928 bytes (64 GB, 59 GiB) copied, 1386,27 s, 45,9 MB/s
출력에서 다음을 확인하세요 dmesg
.
[27430.135999] INFO: task kworker/3:2:12138 blocked for more than 120 seconds.
[27430.136031] Tainted: G C OE 5.11.0-1017-raspi #18-Ubuntu
[27430.136041] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[27430.136050] task:kworker/3:2 state:D stack: 0 pid:12138 ppid: 2 flags:0x00000008
[27430.136067] Workqueue: events_freezable mmc_rescan
[27430.136088] Call trace:
[27430.136092] __switch_to+0xb8/0xe4
[27430.136102] __schedule+0x2bc/0x7dc
[27430.136110] schedule+0x7c/0x110
[27430.136117] __mmc_claim_host+0xc0/0x1f0
[27430.136124] mmc_get_card+0x40/0x50
[27430.136130] mmc_sd_detect+0x2c/0xa0
[27430.136136] mmc_rescan+0xc8/0x314
[27430.136143] process_one_work+0x200/0x4f0
[27430.136151] worker_thread+0x74/0x3c0
[27430.136158] kthread+0x12c/0x140
[27430.136164] ret_from_fork+0x10/0x3c
스택 추적에 SD 카드 관련 기능이 있다는 점을 고려하면 SD 카드 손상이 의심되는 것으로 보입니다.