과거 사용량을 기준으로 사용자에게 작업을 할당하도록 Slurm을 구성하려고 합니다. 목표는 과거의 기본 GPU 사용량을 고려하여 작업 우선순위를 지정하는 것입니다. 가중치를 구성하려면 FairShare 트리를 사용해야 한다는 것을 알고 있지만 고려할 변수를 Fairshare에 대해 어떻게 구성해야 하는지 잘 모르겠습니다. 나는 이것이 어떻게 작동하는지에 대한 요점을 이해하지 못하는 것 같습니다.
현재 구성은 다음과 같습니다.
###Job Priority##
#Fair tree, multifactor with its parameters (http://slurm.schedmd.com/fair_tree.html)
#PriorityFlags=FAIR_TREE
#PriorityType=priority/multifactor
#PriorityDecayHalfLife=14-0
#PriorityMaxAge=7-0
#PriorityUsageResetPeriod=NONE
#PriorityWeightAge=100
#PriorityWeightFairshare=10000
#Unused weights
#PriorityWeightJobSize=0
#PriorityWeightPartition=0
#PriorityWeightQOS=0
가능한 구성(틀린 경우 수정해 주세요):
###Job Priority##
#Fair tree, multifactor with its parameters (http://slurm.schedmd.com/fair_tree.html)
PriorityType=priority/multifactor
#PriorityDecayHalfLife=14-0 PriorityMaxAge=7-0 PriorityWeightAge=1000 PriorityWeightFairshare=10000
#Unused weights PriorityWeightJobSize=100 PriorityWeightPartition=0 PriorityWeightQOS=0
PriorityUsageResetPeriod=MONTHLY
AccountingStorageTRES=gres/gpu,gres/gpu:geforce_rtx_1080,gres/gpu:titan,gres/gpu:quadro,gres/gpu:geforce_rtx_3090,gres/gpu:v100
TRESBillingWeights="CPU=1.0,Mem=0.25G,gres/gpu=1.0"
이것으로 문제가 해결될까요? TRESBilling의 가중치를 변경하시겠습니까?
답변해 주신 분들께 감사드립니다!