![Slurm 오류에서 잘못된 노드 이름을 찾는 방법: "sbatch: 오류: 일괄 작업 제출 실패: 지정된 노드 이름이 잘못되었습니다."](https://linux55.com/image/210925/Slurm%20%EC%98%A4%EB%A5%98%EC%97%90%EC%84%9C%20%EC%9E%98%EB%AA%BB%EB%90%9C%20%EB%85%B8%EB%93%9C%20%EC%9D%B4%EB%A6%84%EC%9D%84%20%EC%B0%BE%EB%8A%94%20%EB%B0%A9%EB%B2%95%3A%20%22sbatch%3A%20%EC%98%A4%EB%A5%98%3A%20%EC%9D%BC%EA%B4%84%20%EC%9E%91%EC%97%85%20%EC%A0%9C%EC%B6%9C%20%EC%8B%A4%ED%8C%A8%3A%20%EC%A7%80%EC%A0%95%EB%90%9C%20%EB%85%B8%EB%93%9C%20%EC%9D%B4%EB%A6%84%EC%9D%B4%20%EC%9E%98%EB%AA%BB%EB%90%98%EC%97%88%EC%8A%B5%EB%8B%88%EB%8B%A4.%22.png)
이 bash 스크립트의 경우 "sbatch: 오류: 일괄 작업 제출 실패: 지정된 노드 이름이 유효하지 않습니다."라는 오류가 발생합니다.
#!/bin/bash -l
#SBATCH --gpus=1
#SBATCH -p overcap
#SBATCH -A overcap
#SBATCH --signal=USR1@120
#SBATCH --time=10:00
#SBATCH --requeue
#SBATCH --nodelist=brainiac,omgwth,cyborg,sonny,robby,spd-13,qt-1,dave,nestor,crushinator,deebot,xaea-12,baymax,megabot,randotron,chappie,heistotron,roberto,herbie,shakey,chitti,samantha,clippy,kitt,tachikoma
#SBATCH -o err_test.out
srun python src/train.py
목록에서 어떤 노드가 유효하지 않은지 알아내는 방법이 있나요?
답변1
slurm으로 구성된 유효한 노드 이름 목록을 사용하거나 sinfo
가져올 수 있습니다. sinfo -N
그런 다음 스크립트에 있는 내용과 비교하세요.