mpirun -np x task를 통해 작업이 x배 증가할 때 PBS 출력 "mem"과 "vmem"이 동일하게 유지된다는 것을 이해하는 방법

Question

확실하지는 않지만 제가 기억하는 한 MPI는 노드당 하나의 인스턴스만 시작한 다음 일부 초기화 후에 프로세스를 요청된 x복제본으로 포크합니다. 즉 sim.exe, 포크 이후 추가 메모리를 할당하지 않으면 모든 메모리가 복제본 간에 공유되며, x그 양은 프로세스를 추적하기 위한 운영 체제의 작은 오버헤드 외에는 메모리 사용량에 영향을 미치지 않습니다.x

분기 후 일부 데이터를 로드하거나 일부 메모리를 할당하면 메모리 사용량과 x.

스레드 하위 프로세스 시나리오에서는 모든 x프로세스가 자체 초기화를 수행하므로 MPI 시나리오만큼 많은 메모리가 공유되지 않습니다. (그들은 여전히 라이브러리 메모리와 유사한 메모리 매핑 I/O를 공유합니다.)

이 동작을 완전히 이해하려면 이를 대체할 작은 MPI 프로그램을 작성하고 sim.exe몇 MB의 정적 데이터(예: 일부 유형의 정적 배열)와 동적으로 할당된 메모리를 사용하여 인스턴스 크기와 수량을 실험해 볼 것을 제안합니다. . 내 생각엔 정적 데이터는 동일한 노드의 병렬 MPI 인스턴스 간에 공유되는 반면 동적 데이터(MPI가 인스턴스를 포크한 후에 할당됨)는 공유되지 않는 것 같습니다.

추가 자료: fork()의 쓰기 중 복사는 여러 분기를 어떻게 처리합니까?

Answer 1

확실하지는 않지만 제가 기억하는 한 MPI는 노드당 하나의 인스턴스만 시작한 다음 일부 초기화 후에 프로세스를 요청된 x복제본으로 포크합니다. 즉 sim.exe, 포크 이후 추가 메모리를 할당하지 않으면 모든 메모리가 복제본 간에 공유되며, x그 양은 프로세스를 추적하기 위한 운영 체제의 작은 오버헤드 외에는 메모리 사용량에 영향을 미치지 않습니다.x

분기 후 일부 데이터를 로드하거나 일부 메모리를 할당하면 메모리 사용량과 x.

스레드 하위 프로세스 시나리오에서는 모든 x프로세스가 자체 초기화를 수행하므로 MPI 시나리오만큼 많은 메모리가 공유되지 않습니다. (그들은 여전히 라이브러리 메모리와 유사한 메모리 매핑 I/O를 공유합니다.)

이 동작을 완전히 이해하려면 이를 대체할 작은 MPI 프로그램을 작성하고 sim.exe몇 MB의 정적 데이터(예: 일부 유형의 정적 배열)와 동적으로 할당된 메모리를 사용하여 인스턴스 크기와 수량을 실험해 볼 것을 제안합니다. . 내 생각엔 정적 데이터는 동일한 노드의 병렬 MPI 인스턴스 간에 공유되는 반면 동적 데이터(MPI가 인스턴스를 포크한 후에 할당됨)는 공유되지 않는 것 같습니다.

추가 자료: fork()의 쓰기 중 복사는 여러 분기를 어떻게 처리합니까?

mpirun -np x task를 통해 작업이 x배 증가할 때 PBS 출력 "mem"과 "vmem"이 동일하게 유지된다는 것을 이해하는 방법

답변1

관련 정보