fusionr -v /dev/nvidia* 및 lsof가 응답하지 않습니다.
A100 시스템에는 중지된 후에도 계속해서 메모리를 할당하는 좀비 프로세스가 있는 경우가 많습니다. 나는 보통 이것을 fuser -v /dev/nvidia*모든 프로세스의 PID를 결정하고 사용하거나 종료하는 데 kill사용 합니다 fuser -k /dev/nvidia*. fuser결과를 반환하는 데 항상 시간이 걸립니다. 그러나 이제는 합당한 시간 동안 응답하지 않고 명령이 무기한 fuser -v중단됩니다 . fuser -k예를 들어 지난번에는 주말 동안 실행했는데 돌아오지 않았습니다. 결국 서버를...