시스템 충돌 시 자동으로 다시 시작하는 방법

시스템 충돌 시 자동으로 다시 시작하는 방법

저는 은행에서 일하고 있는데 현금 지급기가 계속 정지되는 문제를 다루고 있습니다. 정지할 때마다 정상으로 돌아가려면 재설정해야 합니다. 하지만 이제는 수동으로 처리하므로 원격 액세스 소프트웨어를 사용하여 현금 인출기를 모니터링하는 데 하루 종일 시간을 보내고 정지된 ATM을 볼 때마다 원격으로 재부팅합니다. 하루 종일 이 작업을 수행하는 것은 매우 스트레스가 많고 지칠 수 있으므로 질문은 다음과 같습니다. ATM 소프트웨어가 정지될 때마다 시스템을 다시 시작하는 방법이 있습니까? 운영체제는 리눅스/데비안입니다.

답변1

우선: 나는 얼어붙은 Linux를 만났고 그 이유는 다음과 같습니다.

  • 하드웨어 문제(RAM 모듈, 하드 드라이브, PCI 카드 오류)

  • 호환되지 않는 커널 모듈, 잘못 컴파일된 커널

  • 해킹

진단 목적으로 저는 보통 SSH 서버를 열어 시스템이 실제로 정지되었는지 테스트합니다.

필요한 장치 이름은 다음과 같습니다.지키는 개. 이러한 장치는 일반적으로 직렬 포트(또는 기타 간단한 신호 회선)에 연결되며 해당 장치의 처리는 일정한 간격으로 간단한 신호의 수신을 기다리는 것입니다. 예를 들어 매분마다 "OK"라는 문자열을 수신할 것으로 예상합니다. (CR)". 그러한 신호가 발생하지 않으면 장치는 CPU 칩의 재설정 핀을 당깁니다. 시스템은 이 문자열을 1분마다 보내야 합니다. 이러한 동작은 구성할 수 있지만 cron여러 가지 이유로 시스템이 제때에 이를 포착하지 못할 수도 있습니다. 시간 외 동기화가 있는 작업은 나중에 Watchdog에 의해 완료될 수 있지만 anacronWatchdog을 통해서는 불가능합니다. 이를 위해서는 RT 코어를 사용하거나 감시 기간을 신중하게 설정하는 것이 좋습니다. (장치는 5분 대기하도록 설정했지만 시스템은 2분마다 전송합니다)

어쨌든 이것은 단순한 소프트웨어 솔루션이 아닙니다.

내 조언은 다음과 같습니다. 먼저 시스템을 확인하고 새로 설치한 후 디스크 이미지로 저장하고(나중에 손상된 시스템과 비교할 수 있도록 더 빠르고 빠르게 복구하기 위해), 계정 서브넷을 더 안전하게 만들고(개인 주소 범위 사용) 격리합니다. NAT 및 방화벽을 통해. ); 이러한 서브넷에 로그 서버를 구축하고 Linux 시스템에 로그를 보내도록 구성하세요.

시스템을 더욱 강력하고 안전하며 상세하게 만드십시오.

관련 정보