torque

CentOS 7: Python2.7.5가 덮어쓰기되어 yum 또는 python2를 사용할 수 없습니다.
torque

CentOS 7: Python2.7.5가 덮어쓰기되어 yum 또는 python2를 사용할 수 없습니다.

CentOS 7 서버에 Torque Queue 시스템을 설치했고, 이를 설치하기 위해 구성 명령을 실행한 후 기본 python2 버전(2.7.5)을 덮어쓰고 python2.7.18로 교체했습니다. Python2.7.18이 내 서버에 설치되어 있지만 환경 모듈 시스템과 통합할 수 있도록 가상 환경으로 전환하려는 의도입니다. 아직 완료되지 않았지만 Python2.7.18은 경로에 추가되지 않았으며 Python과 관련된 명령도 없었습니다. Bash 기록을 살펴본 후 yum 명령이 마지막으로 작동한 때는 T...

Admin

ID가 아닌 작업명으로 작업을 취소할 수 있나요?
torque

ID가 아닌 작업명으로 작업을 취소할 수 있나요?

개별 작업 번호를 각각 입력하는 대신 동일한 이름을 가진 여러 작업을 삭제할 수 있습니까? qdel -u username다른 작업을 해야 하기 때문에 이 옵션을 사용하고 싶지 않습니다 . +100개의 별도 작업이 있으므로 더 빠른 옵션이 있으면 각 작업 번호를 입력하지 않는 것이 좋습니다! 나는 이 옵션을 온라인에서 찾았습니다. qdel wc_jobname 하지만 오류가 반환됩니다. qdel: 불법적으로 형성된 작업 식별자: wc_jobname ...

Admin

PBS 작업 실행이 시작된 후 't' 시간에 생성된 파일
torque

PBS 작업 실행이 시작된 후 't' 시간에 생성된 파일

나는 PBS에 일자리를 제출했습니다 02:00:00 hours. 지정된 시간에 PBS 작업 디렉터리에 파일을 생성해야 합니다.티 (say 01:30:00 hours)작업이 시작된 후 후속 재시작을 위해 작업이 정상적으로 종료되는지 확인하십시오. 예를 들어 아래와 같이 echo "LABORT" > file1.txt 지정된 시간에 정확하게 파일을 생성하고 싶기 때문에 링크 작업을 통해 파일을 생성하기 위해 PBS에 의존하고 싶지 않습니다. 이러한 작업을 많이 실행할 때 이를 달성할 수 있는 깨...

Admin

PrivateTmp=true인 서비스는 /tmp 디렉터리의 Unix 소켓에 어떻게 액세스합니까(예: Apache에서 실행되는 PHP에서 Torque 작업 제출)
torque

PrivateTmp=true인 서비스는 /tmp 디렉터리의 Unix 소켓에 어떻게 액세스합니까(예: Apache에서 실행되는 PHP에서 Torque 작업 제출)

우리는 사용자가 제출한 과학적 계산을 수행하는 웹 서버를 보유하고 있습니다. 계산을 실행하는 데 시간이 오래 걸릴 수 있으므로 다음을 사용합니다.토크리소스 관리자(일명 pbs_server)는 소수의 컴퓨팅 노드에 리소스를 배포/예약합니다. Torque는 /tmp디렉터리의 Unix 도메인 소켓을 사용하여 통신하지만 http 서버(및 여기에서 생성된 프로세스)는 실제 디렉터리에 액세스할 수 없으므로 /tmp이러한 프로세스에서는 소켓이 누락된 것처럼 나타나 오류가 발생합니다. 세부 사항: 웹 서버...

Admin

Torque에서 MOM 노드당 올바른 GPU 수의 자동 업데이트를 비활성화하는 방법은 무엇입니까?
torque

Torque에서 MOM 노드당 올바른 GPU 수의 자동 업데이트를 비활성화하는 방법은 무엇입니까?

Toque 4.2.9의 마이너 버전을 설치했습니다. --enable-nvidia-gpus 옵션으로 컴파일됩니다. 문서에 따르면 이 옵션을 사용하면 노드 파일이 올바른 GPU 수로 자동 업데이트됩니다. 끌 수 있나요? 사용 가능한 리소스를 일시적으로 제한하고 싶어서 이 질문을 드립니다. 어쩌면 이것을 달성하는 다른 방법이 있을까요? ...

Admin

원격 서버에서 셸 작업을 실행하고 작업을 닫지 않고 터미널을 닫습니다.
torque

원격 서버에서 셸 작업을 실행하고 작업을 닫지 않고 터미널을 닫습니다.

원격 서버에서 작업을 실행하기 위해 토크를 사용하고 있습니다. 현재 성가신 문제가 있습니다. 제가 업무를 수행할 때 현재 하고 있는 일은 다음과 같습니다. Teamviewer를 통해 다른 컴퓨터에 로그인 이 컴퓨터에서 ssh원격 서버로도 마찬가지입니다.ssh [email protected] 여기에서 작업 스크립트를 실행하면 sh verycomplicatedrunscript.sh사용자에게 다음 내용이 표시됩니다. I am now running job 1... I am now runni...

Admin

TORQUE qsub를 사용하여 특정 노드를 요청하시겠습니까?
torque

TORQUE qsub를 사용하여 특정 노드를 요청하시겠습니까?

TORQUE qsub가 설치된 클러스터가 있습니다. 작업을 보내고 싶지만 특정 노드 집합 중 하나에서 실행되는지 확인하고 싶습니다. qsub작업이 세트 외부의 노드가 아닌 요청된 세트의 노드 중 하나로 전송되도록 요청에 가능한 노드 목록을 포함하는 것이 가능합니까 ? ...

Admin

GPU "cpuset"과 동일
torque

GPU "cpuset"과 동일

컴퓨터 클러스터를 사용하고 노드를 관리합니다.토크그리고모압. 사용자는 노드에 작업을 제출하고 필요한 리소스 양을 요청할 수 있습니다. #The following submits the job foo.sh to 1 node, requesting 8 cores, and 1 gpu qsub foo.sh -l nodes=1:ppn=8:gpus=1 사용자가 요청한 것보다 더 많은 리소스를 얻을 수 있으므로 활성화했습니다.hwloc 라이브러리(cpusets)을 사용하여 사용자를 제어합니다. 내가 찾은...

Admin

토크를 통해 mpi 속도를 늦추세요
torque

토크를 통해 mpi 속도를 늦추세요

저는 30개 노드와 360개 코어가 있는 클러스터에서 Open MPI와 함께 Torque를 실행하고 있습니다. 나는 mpirun -np N ~./myjob 와 의 벽 시간이 qsub -l nodes=1:ppn=N mpirun -np N ~./myjob 여러 번 다르다는 것을 발견했습니다 . 소규모 작업의 경우 1.2초에서 20초로, 2초에서 37초로 증가하는 식으로 늘어납니다. 대규모 작업의 경우 이러한 차이가 중요해집니다. 이것을 극복하는 방법은 무엇입니까? ...

Admin