SSH/OpenMPI: mpirun 권한이 거부되었지만 ssh는 정상적으로 작동합니다.

SSH/OpenMPI: mpirun 권한이 거부되었지만 ssh는 정상적으로 작동합니다.

OpenMPI를 사용하여 4개 노드(모두 Fedora 22 실행)로 구성된 클러스터를 설정하려고 합니다.

마스터 노드에서 비밀번호 없는 키(~/.ssh/id_dsa)를 생성하고 ~/.ssh/id_dsa.pub를 3개의 슬레이브 노드의 ~/.ssh/authorized_keys에 복사했습니다. 그래서 마스터 노드에서 , , 를 실행 ssh slave1하고 ssh slave2비밀번호 ssh slave3를 입력하지 않고도 해당 노드에 성공적으로 진입할 수 있습니다. 에도 적용됩니다 ssh master.

그러나 .this를 사용하려고 할 때 mpirun실행하는 명령은 다음과 같습니다.

/usr/lib64/openmpi/bin/mpirun -np 32 --hostfile .mpi_hostfile ./testprogram

이것은 출력의 첫 번째 비트입니다.

Permission denied, please try again.
Permission denied, please try again.
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).
ORTE was unable to reliably start one or more daemons.

그런 다음 을 실행하면 ssh slave3"마지막으로 로그인에 성공한 이후 로그인 시도가 2번 실패했습니다."라는 메시지가 표시됩니다. 따라서 mpirun시도한 SSH 인증이 어떤 이유로 실패한 것 같습니다.

을 사용하여 비밀번호 없는 키 기반 인증을 수행할 수 있지만 ssh을 사용하지 않는 이유에 대한 아이디어가 있습니까 mpirun?

참고로 다음과 같습니다 .mpi_hostfile.

# Host file for OpenMPI

# Master node, slots = num cores
localhost slots=8

# Slaves
slave1 slots=8
slave2 slots=8
slave3 slots=8

답변1

이는 Open MPI가 기본적으로 트리 기반 시작 구성표를 사용하기 때문일 수 있습니다. 예를 들어, mpirun을 슬레이브1로 호출하는 머신에서 ssh를 수행한 다음, 슬레이브1에서 슬레이브2로 ssh를 호출하는 등의 작업을 수행합니다.

바라보다http://blogs.cisco.com/performance/tree-based-launch-in-open-mpi그리고http://blogs.cisco.com/performance/tree-based-launch-in-open-mpi-part-2자세한 내용은.

관련 정보