지난 3일 밤 00:00 UTC에 서버가 응답을 중지하고 모든 서비스가 중지되었으며 서버 로드가 1800-3500에 도달했으며 프로세서가 24개만 있습니다. WHM 시작 페이지에서만 로그인할 수 있으며 SSH를 통해 연결할 수 없습니다. WHM 프로세스 관리자에서는 많은 ps -fe
프로세스가 0%에서 13400%까지 많은 로드를 차지하고 있는 것을 볼 수 있습니다. 비슷한 오류가 발생했습니다.2019/02/06 01:00:10 [crit] 24232#0: accept4() failed (23: Too many open files in system); proftpd[3208]: 213.136.76.210 - error: unable to accept an incoming connection: Too many open files in system; kernel: [82478.961892] VFS: file-max limit 131072 reached; [Wed Feb 06 01:39:35 2019] [emerg] (23)Too many open files in system: Couldn't create pollset in child; check system or user limits
또한 어제 lsof를 사용한 후에도 다음과 같은 줄이 많이 나타났습니다.
sshd 31611 root mem REG 8,2 124624 152567850 /lib64/libselinux.so.1
sshd 31611 root mem REG 8,2 22536 152568210 /lib64/libdl-2.12.so
sshd 31611 root mem REG 8,2 58480 152567836 /lib64/libpam.so.0.82.2
sshd 31611 root mem REG 8,2 144208 152568295 /lib64/libaudit.so.1.0.0
sshd 31611 root mem REG 8,2 43256 152567966 /lib64/libwrap.so.0.7.6
sshd 31611 root mem REG 8,2 12688 152567978 /lib64/libfipscheck.so.1.1.0
sshd 31611 root mem REG 8,2 157072 152567862 /lib64/ld-2.12.so
이 문제의 원인을 실제로 찾을 수 없었습니다. CENTOS 6.7에서 WHM v76.0.18을 실행 중입니다.
답변1
문제를 재현할 수 있는 경우:
cron
현재 실행 중인 작업이 있는지 확인하고 해당 작업이 무엇을 하고 있는지 알아보세요. 패키지의 일부는 아니지만 본인이나 다른 사용자가 작성한 스크립트에 특별한 주의를 기울이십시오.ps -fe
여러 프로세스의 상위 프로세스를 확인하세요 . 어쩌면 어딘가에서 문제가 있는 스크립트를 발견했을 수도 있습니다.
실행 중인 sshd
프로세스에서 여러 라이브러리를 여는 것은 정상적인 동작이지만, 실행 중인 프로세스가 많으면 문제가 있음을 나타낼 수 있습니다.