운영체제 = CentOS 7.3
옵션(예: -h -l)을 사용하여 이 서버에서 "df" 명령을 실행하려고 하면 중단되고 좀비 프로세스가 남습니다. Ctrl+z를 눌러 프롬프트로 돌아갈 수 없습니다. FSTAB에서 발견된 특정 마운트 지점에 대해 "df"를 실행하면 명령이 성공적으로 실행됩니다(예: df /home).
이 문제를 어떻게 해결할 수 있나요?
답변1
이는 로컬 파일 시스템 중 하나에서 시스템 호출이 잠기는 증상입니다.
로컬 디스크가 곧 실패할 예정이며 재시도 시 읽기 또는 쓰기가 반복됩니다.
/var/log
루트 또는 /var
파일 시스템이 df
잠금의 원인이 아닌 경우 시스템 로그를 보고 어느 것이 원인인지 확인할 수 있습니다.
답변2
다시 시작하면 문제가 해결되었습니다. 문제가 다시 발생할지는 지켜봐야 할 것 같습니다. Docker 컨테이너를 구성하고 다양한 IPTables 변경을 수행하기 위해 복잡한 구성 스크립트가 실행되었지만 재부팅이 발생하지 않았습니다. 문제가 다시 발생하면 더 자세히 알아보고 RCA를 수행하겠습니다.
dmesg 로그에서 항목을 발견했습니다. 제안해 주신 @Bob에게 감사드립니다.
[252869.529789] 정보: 작업 df:14958이 120초 이상 차단되었습니다. [252869.529838] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs"는 이 메시지를 비활성화합니다.