localhost와 유사한 Slurm 대안

Question 1

내 요구 사항에 완벽하게 맞는 솔루션을 찾았습니다. 제가 겪고 있는 문제는 GPU가 하나뿐인데 작업을 추가하고 작업 상태를 확인하고 필요한 경우 대기열에서 다시 제거할 대기열을 원한다는 것입니다.

Google 조사를 한 후 발견했습니다.작업 스풀러(tsp). 이 명령줄 도구를 사용하면 대기열에 작업을 추가하고 결과를 추적하는 것이 매우 쉽습니다. 지금까지 대기열을 하나만 사용했지만 더 많이 확장할 수 있습니다.

Answer

내 요구 사항에 완벽하게 맞는 솔루션을 찾았습니다. 제가 겪고 있는 문제는 GPU가 하나뿐인데 작업을 추가하고 작업 상태를 확인하고 필요한 경우 대기열에서 다시 제거할 대기열을 원한다는 것입니다.

Google 조사를 한 후 발견했습니다.작업 스풀러(tsp). 이 명령줄 도구를 사용하면 대기열에 작업을 추가하고 결과를 추적하는 것이 매우 쉽습니다. 지금까지 대기열을 하나만 사용했지만 더 많이 확장할 수 있습니다.

Question 2

귀하가 컴퓨터의 유일한 사용자인 경우, hyper-shell(https://hyper-shell.readthedocs.io)에는 필요한 기능이 있습니다. hyper-shell cluster로그인으로 실행 하거나 백그라운드에 그대로 두고 PostgreSQL을 백엔드 데이터베이스로 사용할 수 있습니다. 이는 단일 시스템(특히 단일 리소스 - 한 번에 1개의 작업)에 대한 SLURM을 쉽게 대체할 수 있으며 크로스 플랫폼입니다.

예를 들어 를 사용하여 한 번에 하나의 작업을 제출할 수 있습니다 sbatch.hyper-shell task submitsqueuehyper-shell task search --remaining

구성, 로깅 등에 대한 다양한 옵션이 있습니다. 그러나 스케줄링 서비스의 기본 시작은 다음과 유사합니다.

hyper-shell cluster -N1 --forever --max-retries=2 --capture

면책조항: 저는 의 저자입니다 hyper-shell.

Answer