내 로컬 컴퓨터에서 원격 Linux 서버에 액세스하고 있습니다. 원격 서버에서는 스크립트가 실행되고 있지 않지만 GPU 메모리는 여전히 할당되어 있습니다. 추신: 일부 충돌로 인해 발생할 수 있습니다.
공연 nvidia-smi
:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.47.03 Driver Version: 510.47.03 CUDA Version: 11.6 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA A100-PCI... Off | 00000000:31:00.0 Off | 0 |
| N/A 34C P0 42W / 250W | 19403MiB / 40960MiB | 0% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
| 1 NVIDIA A100-PCI... Off | 00000000:4B:00.0 Off | 0 |
| N/A 35C P0 59W / 250W | 10886MiB / 40960MiB | 0% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 583 C 1001MiB |
| 0 N/A N/A 16158 C 5065MiB |
| 0 N/A N/A 35103 C 1291MiB |
| 0 N/A N/A 46387 C 1337MiB |
| 0 N/A N/A 54860 C 1273MiB |
| 0 N/A N/A 71766 C 2077MiB |
| 0 N/A N/A 80967 C 4991MiB |
| 0 N/A N/A 83598 C 1071MiB |
| 0 N/A N/A 93077 C 1293MiB |
| 1 N/A N/A 583 C 917MiB |
| 1 N/A N/A 47859 C 1297MiB |
| 1 N/A N/A 74282 C 1273MiB |
| 1 N/A N/A 90599 C 7397MiB |
+-----------------------------------------------------------------------------+
종료하려고 하면 "해당 프로세스가 없습니다"라는 오류가 발생합니다.
>>> kill -9 16158
-bash: kill: (16158) - No such process
그리고 ps -p PID
다음 중 하나에서도 프로세스를 감지할 수 없습니다.
>>> ps -p 583
PID TTY TIME CMD
이 기억을 어떻게 풀어낼 수 있나요? 이 문제는 몇 주 동안 계속되었으며 오늘 OOM 문제가 발생했습니다.