가상 머신에 Ubuntu 18.04를 실행하는 Linux 서버가 있습니다. 유사 ls -l
하거나 빈번한 작업은 w
완료하는 데 몇 초가 걸립니다. 몇 밀리초밖에 걸리지 않는다고 strace -c ls -l
하는데 문제가 발생할 때까지 여러 번 실행하면 clone() 시스템 호출이 문제의 원인이라는 것을 알 수 있습니다.ls
strace -c strace -c ls -l
% time seconds usecs/call calls errors syscall
------ ----------- ----------- --------- --------- ----------------
99.33 1.374858 687429 2 clone
0.31 0.004273 8 548 1 wait4
0.20 0.002701 2 1088 ptrace
0.10 0.001416 1 1096 rt_sigprocmask
0.01 0.000130 6 22 mmap
...
------ ----------- ----------- --------- --------- ----------------
100.00 1.384096 2893 15 total
내가 실행한 모든 진단은 RAM/CPU 사용량, 프로세스/스레드 수, IO 성능 등 괜찮은 것 같습니다. 모든 것이 최신 상태입니다. 이 문제는 몇 주 전에 무작위로 시작되어 재부팅 후에도 지속되었습니다. 이 문제를 일으킬 수 있는 것을 아는 사람이 있습니까? 현재 상태에서는 서버가 거의 쓸모가 없습니다.