저는 관리자가 일상적인 Unix/Linux 환경에서 직면할 수 있는 가장 일반적인 이벤트(예: 서비스 중단, 파일 시스템 가득 참, CPU 스파이크, 메모리 가득 참)를 관리하는 데 관심이 있습니다. 그것이 무엇인지 보여주는 연구 결과가 있나요? 특정 기간 동안 대규모 조직이 직면한 사고를 나열하는 공개적으로 사용 가능한 데이터 세트가 있습니까?
답변1
이런 통계는 믿을만하지 않다고 생각합니다. 문제는 종종 사람들이 서비스를 설계하고 개발하는 방식입니다. 일반적인 문제는 로그 파일 회전 및 일반 관리일 수 있습니다. 이후에는 다음과 같은 유형의 문제가 발생할 수 있습니다. 로그 파일이 제대로 닫히지 않고 삭제된 파일을 쓰는 애플리케이션으로 인해 디스크가 가득 차지만 열려 있는 FD는 계속해서 사용됩니다.
그것은 모두 개별 응용 프로그램 소유자가 프로그램을 작성하는 방법에 따라 다릅니다.
조직에서 어떤 응용 프로그램을 사용하고 있는지 살펴보고 사용자 메일링 목록을 확인하여 일반적인 문제가 무엇인지 확인하는 것이 좋습니다. 관심 있는 배포판의 기본 애플리케이션을 살펴보면서 한 단계 더 나아갈 수 있습니다.