Torque에서 MOM 노드당 올바른 GPU 수의 자동 업데이트를 비활성화하는 방법은 무엇입니까?

Torque에서 MOM 노드당 올바른 GPU 수의 자동 업데이트를 비활성화하는 방법은 무엇입니까?

Toque 4.2.9의 마이너 버전을 설치했습니다. --enable-nvidia-gpus 옵션으로 컴파일됩니다. 문서에 따르면 이 옵션을 사용하면 노드 파일이 올바른 GPU 수로 자동 업데이트됩니다. 끌 수 있나요?

사용 가능한 리소스를 일시적으로 제한하고 싶어서 이 질문을 드립니다. 어쩌면 이것을 달성하는 다른 방법이 있을까요?

답변1

이 문제에 대한 해결책은 GPU 지원 없이 Torque를 다시 컴파일하고 클라이언트 패키지를 만드는 것입니다. 그런 다음 새로 생성된 클라이언트 패키지(GPU를 지원하지 않음)를 GPU를 비활성화할 노드에 설치할 수 있습니다.

이 접근 방식의 단점 중 하나는 비활성화할 GPU를 선택할 수 없다는 것입니다. 모두 비활성화하거나 비활성화할 수 있습니다. 두 번째 명백한 단점은 이 작업을 각 노드에서 개별적으로 수행해야 한다는 것입니다. 노드 수가 적거나 일종의 관리 소프트웨어를 사용하는 경우 이는 큰 문제가 아닙니다. 내 생각에 문제는 그것이 개념적인 관점에서 잘못되었다는 것이다.

관련 정보