저는 Linux 시스템(Devuan Daedalus, 커널 버전 6.1.27)에서 실행하기 위해 CUDA CUDA 12.1을 사용하여 일부 프로그램을 작성하고 있습니다.
어떤 이유에서인지(약간 의심스럽기는 하지만 이것은 내 실수일 수 있습니다.) 프로세스가 어느 시점에서 중단되었습니다. SIGINT, SIGTERM 또는 SIGKILL을 보내도 효과가 없습니다. 이 프로세스의 세부 사항은 중요하지 않지만 - 파일 I/O를 수행하지 않고 네트워크를 사용하지 않으며 다른 주변 장치를 사용하지 않습니다. - CUDA API(구체적으로 실행 그래프)만 사용하고 일부 계산을 수행합니다. 메모리에 저장하고 메시지를 표준 출력으로 인쇄합니다.
질문의 첫 번째 부분: 이러한 프로세스를 어떻게 종료할 수 있습니까(머신을 재부팅하는 것 외에)?
이제 이 프로세스가 멈춘 후에는 CUDA API를 사용하는 모든 프로세스도 실행 시작 즉시 (거의) 멈춘 것처럼 보입니다.
따라서 질문의 두 번째 부분은 다음과 같습니다. 다른 프로세스도 중단되는 것을 방지할 수 있습니까?