Linux의 I/O 성능이 예측할 수 없을 정도로 크게 저하됨

Linux의 I/O 성능이 예측할 수 없을 정도로 크게 저하됨

저는 약 6년 동안 아무 문제 없이 데비안을 테스트용으로 사용해왔지만(그냥 정기적으로 업데이트했습니다), 최근에는 "재부팅할 때까지 지속되는 낮은 I/O 성능"으로 요약할 수 있는 무작위 동작이 나타나기 시작했습니다.

문제는 갑자기 모든 디스크 읽기 및 쓰기 속도가 약 5MB/초로 느려지고 이로 인해 지속적인 읽기 및 쓰기가 발생한다는 것입니다. 속도가 너무 낮기 때문에 디스크가 기계적으로 문제를 일으키거나 스트레스를 받지는 않지만 재부팅할 때까지 모든 것이 느려집니다.

컴퓨터의 I/O 하위 시스템은 OCZ Vertex 3 SSD 1개와 WD Caviar Black HDD 2개로 구성됩니다. SSD는 운영 체제의 읽기 중심 부분을 보유하고 HDD의 파티션은 나머지 부분을 보유합니다.

문제를 진단하기 위해 다음을 시도했지만 성공하지 못했습니다.

  • topCPU나 I/O 사용량 모두 폭주 활동을 보이지 않았습니다.
  • hdparm디스크의 일반 성능 등급을 반환합니다( -t하지만 확인만 했습니다).
  • smartctl디스크에 성능 문제가 표시되지 않았습니다. 장기 테스트 결과 디스크가 새것과 같았습니다.

시스템에는 Z77 칩셋, 16GB RAM 및 Intel i7 3770K CPU가 있으며 통계에는 RAM, I/O 또는 CPU 포화 징후가 나타나지 않지만 이러한 문제(특히 커널 공간)를 디버깅한 경험이 없습니다. 어떤 도움이라도 대단히 감사하겠습니다.

업데이트 1:

  • 예방 조치로 각 파티션에서 fsck를 (강제) 실행합니다. 모든 FS가 깨끗합니다.
  • 그런데 한 달 전에 발표된 BIOS 업그레이드를 찾아 적용해봤습니다.
  • 파티션이 50% 이상 채워지지 않았습니다.

업데이트 2:

이틀 동안 문제가 나타나지 않았습니다. 또는 fsckBIOS 업데이트로 시스템의 일부 막힘이 해결되었을 수도 있습니다. 나는 여전히 이 질문을 따르고 있으며 사후 답변으로 마무리하겠습니다.

업데이트 3:

문제가 다시 발생하여 좀 더 파헤쳐 보았습니다. 답변을 참조하시기 바랍니다.

답변1

대용량 디스크 캐시로 인해 문제를 다시 재현할 수 있었습니다. 내 디스크 캐시는 8GB 이상으로 커질 수 있지만 일부 응용 프로그램에서는 이를 좋아하지 않고 I/O에 문제가 있는 것 같습니다.

루트로 디스크 캐시를 삭제하면 echo 3 > /proc/sys/vm/drop_caches문제가 해결될 수 있습니다. 현재로서는 대용량 디스크 캐시가 I/O 성능 저하를 일으키는 이유를 모르겠습니다.

최근 업데이트:추가 조사 결과 캐시에 있는 파일 수가 문제를 유발하는 것으로 나타났습니다. 많은 작은 파일을 디스크에 다시 커밋하려고 하면 디스크가 손상됩니다. 나는 이 시스템을 10년 동안 사용해 왔기 때문에 64비트 데비안을 다시 설치하기로 결정했습니다. 지금 일은 잘 진행되고 있어요. 이는 32비트 운영 체제의 한계를 발견한 10년 간의 업그레이드의 부작용일 수 있습니다.

답변2

의심스러운 소식은 없나요 dmesg?

시스템의 병목 현상에 대한 통찰력을 얻기 위해 시도할 수 있는 더 많은 도구가 있습니다.

  • 통계
  • 지연된 상단
  • 시스템 교수

관련 정보