클러스터에 QoS 제한을 설정하려고 합니다. 특히 누구도 특정 파티션에 작업을 제출할 수 없도록 하고 싶습니다. 그래서 파티션에서 CPU 제한을 활성화했는데 예상대로 작동했지만 Slurm을 다시 시작한 후 제한이 유지되지 않는 것을 발견했습니다. 이것이 정상입니까?
$/opt/slurm/bin/scontrol update PartitionName=login-queue QoS=login-node
$scontrol show partition login-queue
PartitionName=login-queue
AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
AllocNodes=ALL Default=NO QoS=login-node
DefaultTime=NONE DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
MaxNodes=1 MaxTime=UNLIMITED MinNodes=0 LLN=NO MaxCPUsPerNode=UNLIMITED MaxCPUsPerSocket=UNLIMITED
NodeSets=login-queue_nodes
Nodes=login-queue-st-t3medium-1
PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
OverTimeLimit=NONE PreemptMode=OFF
State=UP TotalCPUs=2 TotalNodes=1 SelectTypeParameters=NONE
JobDefaults=(null)
DefMemPerNode=UNLIMITED MaxMemPerNode=UNLIMITED
TRES=cpu=2,mem=3891M,node=1,billing=2
ResumeTimeout=GLOBAL SuspendTimeout=GLOBAL SuspendTime=GLOBAL PowerDownOnIdle=NO
$systemctl restart slurmctld.service
$scontrol show partition login-queue
PartitionName=login-queue
AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
AllocNodes=ALL Default=NO QoS=N/A
DefaultTime=NONE DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
MaxNodes=1 MaxTime=UNLIMITED MinNodes=0 LLN=NO MaxCPUsPerNode=UNLIMITED MaxCPUsPerSocket=UNLIMITED
NodeSets=login-queue_nodes
Nodes=login-queue-st-t3medium-1
PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
OverTimeLimit=NONE PreemptMode=OFF
State=UP TotalCPUs=2 TotalNodes=1 SelectTypeParameters=NONE
JobDefaults=(null)
DefMemPerNode=UNLIMITED MaxMemPerNode=UNLIMITED
TRES=cpu=2,mem=3891M,node=1,billing=2
QoS=N/A
다시 시작한 후
지속되도록 설정하는 방법이 있습니까? 필요한 다른 로그를 공유해 드리겠습니다.