CUDA를 사용하는 프로세스가 중단되고 다른 모든 프로세스도 중단됩니다. 어떻게 해야 합니까?

CUDA를 사용하는 프로세스가 중단되고 다른 모든 프로세스도 중단됩니다. 어떻게 해야 합니까?

저는 Linux 시스템(Devuan Daedalus, 커널 버전 6.1.27)에서 실행하기 위해 CUDA CUDA 12.1을 사용하여 일부 프로그램을 작성하고 있습니다.

어떤 이유에서인지(약간 의심스럽기는 하지만 이것은 내 실수일 수 있습니다.) 프로세스가 어느 시점에서 중단되었습니다. SIGINT, SIGTERM 또는 SIGKILL을 보내도 효과가 없습니다. 이 프로세스의 세부 사항은 중요하지 않지만 - 파일 I/O를 수행하지 않고 네트워크를 사용하지 않으며 다른 주변 장치를 사용하지 않습니다. - CUDA API(구체적으로 실행 그래프)만 사용하고 일부 계산을 수행합니다. 메모리에 저장하고 메시지를 표준 출력으로 인쇄합니다.

질문의 첫 번째 부분: 이러한 프로세스를 어떻게 종료할 수 있습니까(머신을 재부팅하는 것 외에)?

이제 이 프로세스가 멈춘 후에는 CUDA API를 사용하는 모든 프로세스도 실행 시작 즉시 (거의) 멈춘 것처럼 보입니다.

따라서 질문의 두 번째 부분은 다음과 같습니다. 다른 프로세스도 중단되는 것을 방지할 수 있습니까?

관련 정보