저는 Linux 시스템에서 실행되는 프로세스를 모니터링하고 프로세스가 중단되거나 끝없이 실행되는 시기를 빠르게 확인하는 데 관심이 있습니다. 이를 확인한 후에는 몇 가지 조치(예: 일부 디버깅 정보 덤프, 프로세스 다시 시작 등)를 수행하고 싶습니다.
systemd를 사용하여 중단된 프로세스를 감지할 수 있다는 것을 알고 있지만 안타깝게도 조치를 취할 수 없습니다. 일부 프로세스 하트비트가 손실될 때 실행할 스크립트를 어디에서 지정할 수 있습니까?
Watchdog Monitor와 유사한 다른 도구를 알고 계십니까? (프로세스는 여기에 등록하고 하트비트 전송을 시작할 수 있으며 일부가 누락된 경우 도구가 조치를 취합니다.
나는 나만의 도구를 작성할 수 있다는 것을 알고 있습니다. 이 기능을 제공하는 다른 도구가 있는지 궁금합니다.
고마워요 안드레아
답변1
problem->action
다음과 같이 대부분의 내장 Linux 모니터링 도구가 제공할 수 있는 것보다 더 많은 유형의 모니터링 기능을 갖춘 제품을 찾고 있는 것 같습니다 .
- 맨 위
- 가상 머신 상태
- 라소프
- TCP 덤프
- 네트워크 통계
- 맨 위
- 오토프
- iostat
http://www.zabbix.com/
또는 같은 http://www.nagios.org/
시스템 모니터링을 살펴보는 것이 좋습니다 . 저는 현재 zabbix를 사용하여 회사의 여러 네트워크에 있는 300개 이상의 고유 호스트를 모니터링하고 있습니다. 사용자 정의 모니터링 매개변수를 생성하는 데 적합하며, 쉽게 시각적으로 모니터링하고 문제를 해결할 수 있도록 기록 데이터를 차트로 표시할 수도 있습니다. 다음과 같은 질문을 만들 수도 있습니다 actions
. (이것은 실제 구문이 아니며 단지 아이디어일 뿐입니다.)if cpu>80% -> email [email protected] "There is a problem!"