SGE 작업 스케줄러를 사용하여 Linux 클러스터에 작업을 제출했습니다. 작업 통계가 qw 길어서 "qstat -f"를 사용하여 컴퓨팅 노드 통계를 확인했습니다.
통계 "d", "adu" 및 "E"라는 라벨이 붙은 많은 노드를 발견했습니다. 이 통계가 무엇을 의미하는지 궁금합니다. 이것그리드 엔진 매뉴얼 페이지대기열 인스턴스 필터링에 대한 통계가 나열되어 있지만( -qs {a|c|d|o|s|u|A|C|D|E|S}
), 이러한 통계의 의미는 더 이상 설명되지 않습니다.
상태는 무엇을 의미하나요?
답변1
나는 경험을 통해 다음과 같은 사실을 알고 있습니다.
qw
- 줄을 서서 기다리고 있다E
- 실수a
- 알람 상태를 나타냅니다.du
- 사용자에 의해 삭제됨
다음은 테이블입니다.
-explain
스위치를 사용하여 자세히 알아볼 수도 있습니다 qstat
.
-explain a|A|c|E
'c' displays the reason for the c(onfiguration ambigu-
ous) state of a queue instance. 'a' shows the reason
for the alarm state. Suspend alarm state reasons will
be displayed by 'A'. 'E' displays the reason for a
queue instance error state.
The output format for the alarm reasons is one line per
reason containing the resource value and threshold. For
details about the resource value please refer to the
description of the Full Format in section OUTPUT
FORMATS below.