서버가 있습니다:
CentOS Linux release 7.3.1611 (Core)
3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
내 생각에는 네트워크 연결이 한 지점에서 끊어졌던 것 같습니다(지금은 다시 켜져 있습니다). /var/log/messages에서 아무 것도 찾을 수 없습니다. 어쩌면 무엇을 찾아야 할지 모르겠나요?
기본적으로 저는 네트워크 카드에 문제가 있는지, 그리고 서버의 인터넷 연결이 끊어지는지 두 가지를 찾고 있습니다.
두 번째는 분명히 알아내기가 더 어렵습니다(어쩌면 불가능할까요?). 분명히 외부 모니터링 솔루션이 있어야 하지만 교육적인 관점에서 이 미스터리를 해결하기 위해 (로컬 호스트의) 어디를 살펴보겠습니까?
답변1
링 커널 버퍼( dmesg
)를 확인하세요. 네트워크 연결 이벤트에 대한 정보가 표시되어야 합니다.
답변2
NIC의 링크가 손실되면 커널 로그(볼 수 있는 최신 로그 dmesg
, 이전 로그 journalctl -k
또는 구성된 모든 로그)에 메시지가 포함될 수 있습니다. /etc/rsyslog.conf
물론, 케이블을 뽑아보면 이러한 메시지가 어떤 모양인지 쉽게 알 수 있습니다. 예:
Jan 13 11:16:33 Zia kernel: r8169 0000:07:01.0 lan: link down
인터넷 연결이 끊어지는 것은 더 어렵습니다. 일반적으로 이를 감지할 수 있는 장치를 설정합니다(외부 모니터링 또는 컴퓨터에서 외부 컴퓨터 모니터링). 실제로 바이너리 상태도 아닙니다. 부분적인 인터넷 연결이 있을 수 있습니다(일부 호스트에 연결할 수 있지만 전부는 아님). 그러나 다음과 같은 단서를 찾을 수 있습니다.
- NTP의 메시지(예: 누락된 피어에 대한 정보)를 저널/로그하거나 NTP 피어 통계를 확인합니다(활성화된 경우).
- 실패한 네트워크 연결에 대한 로그/로그 메시지(예: fetchmail을 정기적으로 실행하면 POP3 서버에 연결할 수 없다고 불평합니다)
- VPN 연결이 끊어졌습니다(인터넷 연결이 끊어지면 수많은 OpenVPN 로그를 얻습니다).
- 갑자기 웹(등) 서버의 로드가 0이 되었습니다. 많은 서버는 수신된 모든 요청을 일부 서버별 로그에 기록합니다.
- 마찬가지로 시스템 로드(로드 평균, 실행 큐 등)를 기록하는 경우 0으로 빠르게 떨어지는 것이 단서입니다.
- 방화벽 로그에 잡음이 없습니다(적어도 차단된 패킷을 기록하는 경우).
- 갑작스러운 무작위 웜 공격 부족(실행 중인 다양한 서비스에서 수많은 인증 실패 메시지를 받고 있으며 몇 시간 동안 메시지를 받지 못한다면 인터넷에 연결되어 있지 않다는 좋은 단서가 될 것입니다)
- 모니터링하는 경우(예: Cacti, MRTG, Collectd 등을 사용하여) 트래픽 수준입니다. 그렇지 않은 경우 ISP가 공유할 의향이 있을 수도 있습니다.
- 이 시스템과 통신하는 다른 시스템이 있는 경우 해당 시스템의 로그를 확인하십시오. 실패 메시지가 있을 수 있습니다.
- 귀하가 다른 사람에게 서비스를 제공하는 경우 해당 사람에게 로그가 있을 수 있습니다.
- 지원 데스크가 있다면 아마도 (수신하는 모든 전화를 통해) 알고 있을 것입니다.
기본적으로 여러분은 탐정 작업을 하고 있습니다. 단서를 찾아야 합니다. 모니터링 없이는 불가능합니다인터넷이 다운되었습니다메시지를 기록합니다.