HPC에서 IMB 2017 및 HPCC 1.5.0 벤치마크를 수행하여 모든 것이 올바르게 구성되었는지 확인하고 싶습니다.
우리는 각각 16개의 코어와 32GB의 메모리를 갖춘 32개의 컴퓨팅 노드를 보유하고 있습니다. 각 노드에는 포트 속도가 40Gb/s인 qlogic infiniband 카드가 있습니다.
사용된 운영 체제는 RHEL 6.5 및 IBM 플랫폼 HPC 4.2입니다.
Ofed 용도: IntelIB-OFED.RHEL6-x86_64.3.5.2.34
GCC: GCC 버전 4.4.7
IBM Platform MPI(PMPI) 및 OpenMPI 2.0.1(OMPI)을 사용하여 IMB 및 HPCC를 컴파일했습니다.
IMB
Infiniband 링크에서 PMPI 및 OMPI를 사용하여 IMB 벤치마크를 수행할 때 최대#--------------------------------------------------- # Benchmarking PingPong # #processes = 2 #--------------------------------------------------- #bytes #repetitions t[usec] Mbytes/sec 0 1000 1.51 0.00 1 1000 1.51 0.63 ... ... ... ... 2097152 20 675.20 2962.09 4194304 10 1320.45 3029.26
3029MB/s 처리량은 4000Mb/s에 가까울 것으로 예상했습니다. 이것이 맞습니까?
내가 사용한 HPCC이 웹사이트테스트 구성 파일을 생성합니다.
25개 미만의 노드를 사용하여 벤치마크를 실행할 때 테스트에는 문제가 없습니다. 테스트가 완료될 때까지 기다리지 않지만 문제는 모든 노드에서 벤치마크를 시작할 때 2~5초 후에 이 오류가 발생한다는 것입니다. 메시지:compute014.6359Exhausted 1048576 MQ irecv request descriptors, which usually indicates a user program error or insufficient request descriptors (PSM_MQ_RECVREQS_MAX=1048576)
벤치마크가 종료되고 종료됩니다. 동일한 노드가 아니며 매번 다른 노드입니다. 어떤 아이디어가 있나요?
다음은 hpcc 벤치마크를 시작하는 데 사용되는 명령입니다:
OMPI:mpirun -np 512 --display-allocation --mca btl self,sm --mca mtl psm --hostfile hosts32 /shared/build/hpcc-150-blas-ompi-201/hpcc hpccinf.txt
PMPI:
mpirun -np 512 -PSM -hostfile hosts32 /shared/build/hpcc-150-blas-pmpi/hpcc hpccinf.txt
더 많은 정보가 필요하면 알려주시기 바랍니다.