OOM 킬러는 ulimit(ed)를 어떻게 처리합니까?

Question

세 가지 사실의 조합으로 인해 oom 문제가 발생할 수 있습니다.작은 페이지 크기,대형 VIRT,페이지 테이블. 로그에는 거의 모든 RAM이 프로세스 메모리가 아닌 페이지 테이블에서 사용된다는 사실이 명확하게 나와 있습니다(예: 상주 페이지가 아닌 페이지는 대부분 스왑을 위해 푸시됩니다).

x86_64/x86 페이지 테이블의 나쁜 점은 정확히 동일한 공유 메모리 영역을 매핑하는 여러 프로세스가 있을 때 해당 프로세스가 그대로 유지된다는 것입니다.분리페이지 테이블. 따라서 프로세스가 1TB(VIRT에 포함됨)를 매핑하면 커널은 1GB의 페이지 테이블을 생성합니다( top프로세스에 속하는 것으로 계산되지 않으므로 전혀 표시되지 않음). 그러나 100개의 프로세스가 동일한 1TB 영역을 매핑하는 경우 동일한 메타데이터를 중복 저장하기 위해 100GB의 RAM을 차지하게 됩니다!

단일 프로세스에 대한 VIRT의 양은 단순히 파일(이름 또는 "익명")을 열고 매핑함으로써 발생할 수 있지만 다른 많은 설명이 있을 수 있습니다.

oom killer는 프로세스를 종료할 때 페이지 테이블 크기를 고려하지 않는 것 같습니다. 귀하의 경우, 분명히 mongodb는 RES 사용 측면에서 oom Kill의 주요 후보입니다. 얻은 메모리는 최소화되었지만 시스템에는 선택의 여지가 없었으므로 가능한 모든 것을 종료했습니다.

문제를 피하는 가장 확실한 방법은 다음을 사용하는 것입니다.큰 페이지, mongodb만 이를 지원하는 경우(투명 거대 페이지 사용을 권장하지 않지만 일반 불투명 거대 페이지를 고려합니다). 대략적인 검색 결과, 슬프게도 mongodb는 불투명한 hugepages도 지원하지 않는 것으로 나타났습니다.

또 다른 접근 방식은 생성 프로세스 수를 제한하거나 어떤 방식으로든 해당 VIRT 크기를 줄이는 것입니다.

Answer 1