데스크톱의 Slurm, 소유자 우선순위를 지정하는 방법

Question

며칠 후 나는 내 질문에 답할 수 있었습니다. 돌이켜보면 쉬웠다.

민감도: slurmd 데몬 은 slurmd -h. slurmd -n 19데스크탑 컴퓨터에서는 그냥

편집 후 에 /etc/systemd/system/slurmd.service추가합니다 . 즉,-n 19ExecStartExecStart=/usr/local/sbin/slurmd $SLURMD_OPTIONS -n 19
systemd 데몬을 다시 로드하세요.systemctl daemon-reload
slurmd 데몬을 다시 시작합니다.systemctl restart slurmd.service

메모리 예약: 일부 메모리는 시스템용으로 예약될 수 있습니다. MemSpecLimit=8000노드 사양을 추가하여 소유자에게 8GB를 남겨 두었 습니다 slurmd.conf. 실제로 메모리 제한을 적용하려면 몇 가지 추가 단계가 필요합니다.

SelectTypeParameters=CR_Core_MemoryCore와 Memory를 에서 설정하여 소비되는 리소스로 선택합니다 slurmd.conf.
TaskPlugin=task/affinity,task/cgroup설정 을 통해 cgroups 작업 플러그인을 추가한 slurmd.conf다음 .ConstrainRAMSpace=yescgroup.conf
GRUB_CMDLINE_LINUX="cgroup_enable=memory swapaccount=1"Ubuntu를 사용하고 있으므로 다음 줄을 추가하여 메모리 및 스왑 cgroup을 활성화합니다./etc/default/grub

평일 근무시간 내 동료 중 일부는 근무 시간 동안 방해 요소가 전혀 없기를 원합니다. 이는 scontrol헤드 노드에서 쉽게 수행할 수 있으며, 작업 시간 동안 노드 상태를 "끄기"로 설정하고 작업 시간 후에 "재개"로 설정합니다. 나는 이것을 자동화하기 위해 systemd 타이머를 사용합니다.

먼저 다음 명령을 사용하여 관련 데스크톱의 노드 상태를 업데이트하는 실행 가능한 스크립트를 만듭니다 scontrol.

#!/bin/bash
# slurm-update.sh - Updates the state on nodes belonging to the work-hour desktops partition.
systemctl start slurmd
for node in $(sinfo -h --partition=WHdesktops --format="%n"); do
        state=$(sinfo -h --node=$node --format="%T")
        echo "Setting node $node to state=$1 with reason=$2"
        scontrol update NodeName=$node state=$1 reason="$2" || echo "State on $node is already $(sinfo -h --node=$node --format=\"%T\")"
done

여기에는 새 상태와 해당 이유라는 두 가지 매개변수가 필요합니다.

/etc/systemd/system특정 시간에 위 스크립트를 실행하려면 디렉터리에 서비스/타이머 파일 쌍을 만듭니다 . 설정하려는 각 상태에 대해 쌍을 만듭니다(예를 들어 설정, 배수 및 복구를 위해 3개의 쌍을 만들었습니다). "아래"로 설정된 쌍은 다음과 같습니다.

# /etc/systemd/system/slurm-down.service:
[Unit]
Description=Shut down all SLURM desktop nodes
[Service]
Type=simple
ExecStart=/bin/bash /mnt/nfs/slurm_fs/systemd/slurm-update.sh down afterhours
StandardError=journal

그리고

# /etc/systemd/system/slurm-down.timer:
[Unit]
Description=Timer for shutting down slurm on desktop nodes on weekdays
[Timer]
Unit=slurm-down.service
OnBootSec=10min
# Run hourly on weekdays between 8:05 to 18:05
OnCalendar=Mon..Fri *-*-* 8..18:05:00
[Install]
WantedBy=multi-user.target

다시 로드 데몬을 사용한 systemctl daemon-reload다음 서비스가 아닌 타이머만 활성화하고 시작합니다 systemctl enable --now slurm-down.timer.
몇 시간 후에 상태를 복원하는 단계를 반복하고 선택적으로 가동 중지 시간 1시간 정도 전에 배수 상태를 반복합니다.

Answer 1