저는 30개 노드와 360개 코어가 있는 클러스터에서 Open MPI와 함께 Torque를 실행하고 있습니다. 나는 mpirun -np N ~./myjob
와 의 벽 시간이 qsub -l nodes=1:ppn=N mpirun -np N ~./myjob
여러 번 다르다는 것을 발견했습니다 . 소규모 작업의 경우 1.2초에서 20초로, 2초에서 37초로 증가하는 식으로 늘어납니다.
대규모 작업의 경우 이러한 차이가 중요해집니다. 이것을 극복하는 방법은 무엇입니까?
답변1
분명히 그것은 채우기에 달려 있습니다 ./myjob
. 이 스크립트에 파일 생성 및 읽기가 포함되어 있으면 해당 파일이 생성됩니다.질소시간과 시간의 판독은 간섭을 유발합니다. 바이너리라면 속도 저하도 없고 ./myjob
실행 시간도 거의 동일합니다.