여전히 메모리를 차지하고 있지만 이를 사용하는 프로세스가 없는 NVIDIA A100 카드를 재설정하려고 합니다. 먼저 NVIDIA 카드를 사용하여 모든 프로세스를 종료했습니다.
sudo fuser -k /dev/nvidia*
그런 다음 재설정 명령을 실행하십시오.
sudo nvidia-smi -r
하지만 아직 GPU를 사용하는 프로세스가 있다고 합니다. 실행하면 일부 프로세스 와 해당 PID가 sudo fuser -v /dev/nvidia*
나열됩니다 . 그러나 아무것도 반환되지 않으며( 프로세스 자체 제외) 생성된 동일한 존재하지 않는 프로세스가 표시됩니다 .gpustat
nvidia-smi
ps aux | grep $PID
grep
sudo kill $PID
kill: ($PID): No such process
lsof
더 이상 존재하지 않는 것으로 보이는 레코드에 프로세스가 여전히 존재하는 이유는 무엇이며 어떻게 삭제합니까?