실행 중인 프로세스를 종료할 수 없습니다(좀비 프로세스 아님).

실행 중인 프로세스를 종료할 수 없습니다(좀비 프로세스 아님).

응, 나도 이 질문에 대해 알아가지다 계속 ~ 이다 묻다 만약에 아니요 수백 ~의 이류 앞으로. 그래도 비슷한 질문을 모두 살펴보고 거기에 나열된 모든 것을 시도했지만 소용이 없었습니다.

Ubuntu 21.04( )를 실행하는 Raspberry Pi 4 모델 B에서 일부 코드를 컴파일한 후 Linux rpi4 5.11.0-1017-raspi #18-Ubuntu SMP PREEMPT Mon Aug 23 07:34:31 UTC 2021 aarch64 aarch64 aarch64 GNU/Linuxccache가 멈추고 거의 한 시간 동안 100% CPU에서 실행되었습니다. ps -l문제의 프로세스의 출력 은 다음과 같습니다 .

$ ps -l -p 7580
F S   UID     PID    PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
1 R  1000    7580       1 99  80   0 -  1725 -      pts/2    00:54:10 ccache

나는 kill그것을 하려고 노력한다 kill -9. 효과가 없습니다. 좀비가 아니라 좀비처럼 보입니다. 실행 중:

$ sudo cat /proc/7580/syscall 
running

strace나는 그것을 사용하고 추가하려고 시도했지만 gdb둘 다 중단되었습니다.

나는 상위 프로세스(그림 참조 ps auxf)를 찾고 모든 상위 프로세스를 종료한 다음 문제가 되는 프로세스를 다시 종료해 보았습니다. 작동하지 않습니다.

나는 그 과정을 시작할 때까지 달리고 demsg, 살펴보고 /var/log/syslog, 어깨 너머로 살펴보았습니다. 디버깅하는 데 도움이 되는 단서를 찾지 못했습니다.

일반적으로 재부팅하고 계속 생활하지만 이번이 하루에 세 번째 재부팅이므로(ccache로 인해 두 번, cpuUsage.shVS Code 원격 설치를 호출하는 셸 스크립트로 인해 한 번) 이것이 표준이 될 것으로 의심됩니다. 앞으로. 나는 이 보드를 몇 달 동안 사용해 왔지만 오늘까지 이런 일이 일어난 적이 없습니다.

나의 유일한 합리적이지만 확인되지 않은 가정은 마더보드 부팅 SD 카드가 불량일 수 있다는 것인데, 이를 진단하는 방법을 모르겠습니다.

이 프로세스를 종료하는 마법 명령을 알고 싶지만 지금까지 시도한 모든 것을 고려할 때 그런 것이 존재하지 않는다고 확신합니다. 내 질문은: 이런 일이 계속 발생한다고 가정하면 어떻게 진단합니까? 하루에 여러 번 보드를 다시 시작하는 것은 분명히 지속 불가능하며 지금부터 그렇게 해야 할 수도 있다고 생각합니다.

편집하다: 의견에서 제안한 대로 dmesg출력을 볼 때 다음을 시도했습니다.

$ sudo dd if=/dev/mmcblk0p2 of=/dev/null bs=1M
60648+1 records in
60648+1 records out
63595068928 bytes (64 GB, 59 GiB) copied, 1386,27 s, 45,9 MB/s

출력에서 다음을 확인하세요 dmesg.

[27430.135999] INFO: task kworker/3:2:12138 blocked for more than 120 seconds.
[27430.136031]       Tainted: G         C OE     5.11.0-1017-raspi #18-Ubuntu
[27430.136041] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[27430.136050] task:kworker/3:2     state:D stack:    0 pid:12138 ppid:     2 flags:0x00000008
[27430.136067] Workqueue: events_freezable mmc_rescan
[27430.136088] Call trace:
[27430.136092]  __switch_to+0xb8/0xe4
[27430.136102]  __schedule+0x2bc/0x7dc
[27430.136110]  schedule+0x7c/0x110
[27430.136117]  __mmc_claim_host+0xc0/0x1f0
[27430.136124]  mmc_get_card+0x40/0x50
[27430.136130]  mmc_sd_detect+0x2c/0xa0
[27430.136136]  mmc_rescan+0xc8/0x314
[27430.136143]  process_one_work+0x200/0x4f0
[27430.136151]  worker_thread+0x74/0x3c0
[27430.136158]  kthread+0x12c/0x140
[27430.136164]  ret_from_fork+0x10/0x3c

스택 추적에 SD 카드 관련 기능이 있다는 점을 고려하면 SD 카드 손상이 의심되는 것으로 보입니다.

관련 정보