저는 mpi 프로그램을 실행하곤 했습니다 mpirun -n 2 ./a.x
. 그러나 두 프로세스가 모두 중단되었습니다. 그리고 항상 정체되어 있고 거의(실제로는 단 한 번만) 통과되었습니다.
strace
후속 정보를 찾았으며 lsof
두 프로세스 모두 동일한 파일을 읽거나 쓰려고(?) 대기하고 있지만 아직 준비가 되지 않은 것으로 알고 있습니다. 그렇다면 이 파일이 무엇인지, 왜 항상 액세스할 수 없는지 알아내는 방법은 무엇입니까?
혹시 아이디어가 있거나 필요한 것이 있으면 알려주세요. 감사합니다!
//use `strace -p 31352`
epoll_wait(18, [], 100, 0) = 0
epoll_wait(18, [], 100, 0) = 0
epoll_wait(18, [], 100, 0) = 0
<...endless>
//use `strace -p 31351`
epoll_wait(19, [], 100, 0) = 0
epoll_wait(19, [], 100, 0) = 0
epoll_wait(19, [], 100, 0) = 0
<...endless>
//use `lsof -p 31352`
pfci.x 31352 jslo 18u a_inode 0,13 0 11815 [eventpoll]
//use `lsof -p 31351`
pfci.x 31351 jslo 19u a_inode 0,13 0 11815 [eventpoll]