![Torque에서 MOM 노드당 올바른 GPU 수의 자동 업데이트를 비활성화하는 방법은 무엇입니까?](https://linux55.com/image/90968/Torque%EC%97%90%EC%84%9C%20MOM%20%EB%85%B8%EB%93%9C%EB%8B%B9%20%EC%98%AC%EB%B0%94%EB%A5%B8%20GPU%20%EC%88%98%EC%9D%98%20%EC%9E%90%EB%8F%99%20%EC%97%85%EB%8D%B0%EC%9D%B4%ED%8A%B8%EB%A5%BC%20%EB%B9%84%ED%99%9C%EC%84%B1%ED%99%94%ED%95%98%EB%8A%94%20%EB%B0%A9%EB%B2%95%EC%9D%80%20%EB%AC%B4%EC%97%87%EC%9E%85%EB%8B%88%EA%B9%8C%3F.png)
Toque 4.2.9의 마이너 버전을 설치했습니다. --enable-nvidia-gpus 옵션으로 컴파일됩니다. 문서에 따르면 이 옵션을 사용하면 노드 파일이 올바른 GPU 수로 자동 업데이트됩니다. 끌 수 있나요?
사용 가능한 리소스를 일시적으로 제한하고 싶어서 이 질문을 드립니다. 어쩌면 이것을 달성하는 다른 방법이 있을까요?
답변1
이 문제에 대한 해결책은 GPU 지원 없이 Torque를 다시 컴파일하고 클라이언트 패키지를 만드는 것입니다. 그런 다음 새로 생성된 클라이언트 패키지(GPU를 지원하지 않음)를 GPU를 비활성화할 노드에 설치할 수 있습니다.
이 접근 방식의 단점 중 하나는 비활성화할 GPU를 선택할 수 없다는 것입니다. 모두 비활성화하거나 비활성화할 수 있습니다. 두 번째 명백한 단점은 이 작업을 각 노드에서 개별적으로 수행해야 한다는 것입니다. 노드 수가 적거나 일종의 관리 소프트웨어를 사용하는 경우 이는 큰 문제가 아닙니다. 내 생각에 문제는 그것이 개념적인 관점에서 잘못되었다는 것이다.