NVML(nvidia-smi)은 이 그래픽 카드의 온도를 지원하지 않습니다.
nvidia-settings는 클러스터 노드(GPU 3개 포함)이고 X가 없기 때문에 작동하지 않습니다.
lm-센서에 GPU가 표시되지 않음
Ipmitool은 이 작업을 수행하도록 되어 있지만(Google에서 예제를 찾았습니다) 제게는 이 작업이 표시됩니다.
Temp 16 (GPU2) | 1Fh | ns | 11.3 | Disabled
Temp 17 (GPU3) | 20h | ns | 11.4 | Disabled
Temp 18 (GPU1) | 21h | ns | 11.5 | Disabled
이 작업을 수행할 수 있는 다른 명령줄 도구나 라이브러리가 있나요?
어떤 제안이라도 미리 감사드립니다.
드라이버 버전: 304.43
답변1
nvidia-debugdump --help' 명령을 살펴보셨나요? 저는 Tesla의 열렬한 사용자이지만 Linux가 아닌 Windows에서는 죄송합니다. 실제로 테스트할 방법은 없지만 뭔가 도움이 될 것 같은 느낌이 듭니다.