수백 개의 호스트에 대한 기본 매개변수 모니터링 [닫기]

수백 개의 호스트에 대한 기본 매개변수 모니터링 [닫기]

EC2와 Google Compute Engine에는 수백 개의 Linux 가상 머신이 있습니다. 우리는 가능한 가장 간단하고 가벼운 방법으로 디스크 여유 공간 및 메모리 소비와 같은 기본 정보를 모니터링하고 싶었습니다. 부하 변화 등에 따라 가상 머신이 자주 나타나고 사라질 것으로 예상됩니다.

현재 우리는 간단한 스크립트를 사용하여 SNMP를 통해 이 정보를 추출합니다. 이미 애플리케이션별 방식으로 제공되기 때문에 화려한 애플리케이션별 모니터링이 필요하지 않습니다.

Zenoss를 사용해 보았지만 사용하기 어렵고 문서가 부족했습니다.

우리는 Nagios와 그 파생물을 고려했습니다. 우리는 Sensu(그러나 내 상사는 RabbitMQ를 좋아하지 않음)와 Ganglia를 고려했지만 둘 다 우리의 가장 기본적인 요구 사항에 비해 너무 복잡해 보였습니다.

Circonus와 같은 SaaS 솔루션은 우리가 보유한 호스트 수에 비해 너무 비쌉니다.

나는 분명한 것을 놓치고 있습니까?단순한해결책이 여기에 있습니까? [반대] 무엇을 추천하시겠습니까?

답변1

오픈소스 방향에 좀 더 관심을 기울이면,개방형 네트워크 관리귀하의 필요에 맞을 수도 있습니다. 제가 직접 사용해본 적은 없지만 (특히 Nagios를 좋아하지 않는 사람들로부터) 좋은 소식을 들었습니다. 내가 이해한 바로는 SNMP 기반이기도 합니다.

답변2

내 생각엔모은기본 AMI에 추가할 수 있고 중앙 수집기로 데이터를 전송하므로 특히 EC2의 요구 사항에 적합할 수 있습니다.

이렇게 하면 새 인스턴스가 즉시 데이터 전송을 시작하므로 모니터링 시스템을 추가/제거하여 지속적으로 조정할 필요가 없습니다.

사용석묵데이터를 수집하고, 간단한 nagios 설정이나 cron 작업 스크립트를 통해 "normal" 이외의 값이 있는지 확인합니다.

이 기반에서 당신은 쉽게 성장할 수 있습니다.

답변3

제가 개인적으로 가장 좋아하는 것은WhatsUp 골드 프리미엄.

저비용, SNMP 기반, 매우 우수한(역사적) 그리기 기능을 갖추고 있습니다. 마우스를 올리면 그 순간의 실제 판독값이 표시됩니다.

유일한 단점은 Windows 서버와 MS-SQL 데이터베이스(무료 경량 버전과 함께 제공됨)가 필요하다는 것입니다.

이는 귀하와 같은 소규모 환경을 위한 상용 솔루션입니다.

관련 정보