업무용 클러스터(30-60노드)를 구입하고 여기에 Linux를 설치하고 싶습니다. 예를 들어 클러스터에는 PBS와 같은 대기열 시스템이 있어야 합니다. 또한 병렬 컴퓨팅도 가능해야 합니다. 나 자신은 클러스터 구성 및 클러스터 유지 관리에 대해 잘 모르지만 우리 IT 직원은 훨씬 더 적게 알고 있으므로 이러한 시스템을 담당하는 사람이 되고 싶습니다.
내 질문은: 작업이 실행되지 않을 때 노드를 종료하거나 절전 모드로 전환하여 이러한 시스템의 전원을 절약할 수 있는 간단한 (소프트웨어) 방법이 있습니까? 큐 관리자에 연결할 수 있나요?
더 명확하게 설명하지 못해 죄송합니다. 프로세서가 2개 이상인 시스템에 대해 시스템 관리자가 된 것은 이번이 처음입니다.
답변1
이는 일부 코드 개발과 귀하가 클러스터를 구축하는 사람들의 생각이 필요할 수 있는 까다로운 질문입니다.
- 노드는 언제 종료되어야 합니까?
- 언제 키워야합니까?
- 노드가 부팅되면 다른 노드와 동기화되어 있는지 확인하세요(소프트웨어 업데이트가 필요합니까?)
전문가를 고용하는 것 외에도 약간의 전력을 절약하는 가장 좋은 방법은 Linux에서 사용할 수 있는 몇 가지 에너지 절약 유틸리티를 확인하고 사용을 시작하는 것입니다. PowerTOP은 어디에서 돈을 절약할 수 있는지 알아볼 수 있는 좋은 장소입니다. 더 구체적으로 말하면 hdparm과 같은 것이 디스크 속도를 늦출 수 있습니다(아마도). 마지막으로, CPU 속도를 설정하고 다른 프로그램이 실행되고 있지 않을 때 CPU 속도를 줄여 전력을 절약하기 위해 cpufreq를 확인할 수 있습니다. 모든 CPU가 이 기능을 지원하는 것은 아니므로 그다지 확장하지 못할 수도 있습니다.
클러스터는 사용량이 매우 많기 때문에 일반적으로 클러스터를 연중무휴 24시간 내내 실행합니다. 대부분의 경우 활용도가 100%에 도달하지 못하는 것이 걱정된다면 주문형 클라우드 클러스터를 고려해 볼 수 있습니다.무리이렇게 하면 원하는 기간 동안 모든 크기의 미리 만들어진 클러스터를 얻을 수 있습니다.
답변2
전원을 끄려면 종료와 함께 SSH를 사용하여 전원을 끌 수 있습니다. 대부분의 마더보드에서 지원하는 Wake on LAN 기능을 사용하여 필요할 때 노드를 켤 수 있습니다.
또 다른 고려 사항은 저장 공간입니다. 노드를 종료하면 해당 스토리지는 더 이상 클러스터의 스토리지 풀에 기여할 수 없습니다.