디스크 I/O 시간 초과로 인해 디스크 연결 끊김 및 SMR 디스크 데이터 손상이 발생하는 것을 방지하는 방법은 무엇입니까?

Question 1

다음 커널 매개변수를 변경했는데 높은 쓰기 로드에서 SMR 디스크의 연결이 더 이상 끊어지지 않습니다. 때로는 과도한 I/O(예: 한 자릿수 MB/초 쓰기 속도)로 인해 쓰기 성능이 매우 느려질 수 있지만 적어도 디스크 연결이 더 이상 끊어지지 않습니다.

DEVICE=sdX # insert your device name here
echo 3600 > /sys/block/$DEVICE/device/timeout
echo 3600 > /sys/block/$DEVICE/device/eh_timeout
echo noop > /sys/block/$DEVICE/queue/scheduler
echo 1 > /sys/block/$DEVICE/device/queue_depth
echo 4 > /sys/block/$DEVICE/queue/nr_requests

각각을 개별적으로 테스트하지 않았기 때문에 각각을 설정해야 하는지 잘 모르겠지만 이 조합이 제게는 효과적이었습니다.

Answer

다음 커널 매개변수를 변경했는데 높은 쓰기 로드에서 SMR 디스크의 연결이 더 이상 끊어지지 않습니다. 때로는 과도한 I/O(예: 한 자릿수 MB/초 쓰기 속도)로 인해 쓰기 성능이 매우 느려질 수 있지만 적어도 디스크 연결이 더 이상 끊어지지 않습니다.

DEVICE=sdX # insert your device name here
echo 3600 > /sys/block/$DEVICE/device/timeout
echo 3600 > /sys/block/$DEVICE/device/eh_timeout
echo noop > /sys/block/$DEVICE/queue/scheduler
echo 1 > /sys/block/$DEVICE/device/queue_depth
echo 4 > /sys/block/$DEVICE/queue/nr_requests

각각을 개별적으로 테스트하지 않았기 때문에 각각을 설정해야 하는지 잘 모르겠지만 이 조합이 제게는 효과적이었습니다.

Question 2

SMR 드라이브에서 XFS나 ext4를 사용하는 것과 비교해 F2FS를 사용하는 것이 좋은 경험이었습니다. 내 ext4는 SMR 드라이브에서 위에서 설명한 것과 유사한 동작을 나타내므로 Linux에서 SMR 솔루션을 조사해야 합니다. 또한 귀하가 설명하는 시간 초과 문제가 발생했습니다. 나는 또한 Ubuntu를 사용하고 있지만 최신 Ubuntu 18.04.3 LTS 버전을 사용하고 있습니다.

우선, 무작위 읽기/쓰기 작업이 많은 서버에는 SMR 드라이브를 권장하지 않습니다. SMR 사용을 피하고 싶은 사용 사례의 예로는 읽기/쓰기 처리량이 높은 데이터베이스 및 NAS 애플리케이션이 있습니다. 내 사용 사례는 NAS의 외부 백업인데, 이는 시간이 중요하지 않고 대부분 연속적이므로 문제가 되지 않습니다.

가장 먼저 해야 할 일은 F2FS 파일 시스템을 얻는 것입니다. 이는 18.04에서 매우 간단합니다.

sudo apt install f2fs-tools

gpartedSMR 드라이브의 모든 파티션을 삭제한 다음 gparted전체 드라이브에 걸쳐 있는 F2FS 파티션을 생성하는 데 사용 합니다.

내 드라이브(Toshiba)는 MS-Windows 운영 체제 컴퓨터에서 사용할 수 있도록 2개의 파티션으로 사전 포맷되어 제공됩니다. 첫 번째 파티션을 더 작게 유지하면 어떤 파일 시스템을 설치하더라도 쓰기 속도가 끔찍합니다. 나는 첫 번째 파티션이 드라이브의 SMR이 아닌 부분이 로그 및 기타 메타데이터에 할당되는 곳이라고 강하게 의심합니다. 내 경험에 따르면 생성된 파일 시스템이 이 영역에 액세스하여 이점을 얻는 것이 매우 중요합니다.

불행하게도 gparted에는 블록 파티션 SMR 드라이브에 적합한 파일 시스템을 적절하게 생성하기 위한 옵션을 설정할 수 있는 곳이 없는 것 같습니다. 파티션 식별 정보를 기록한 후 gpartedmkfs 명령을 종료하고 수동으로 실행했는데, 이번에는 다음과 같은 마법이 추가되었습니다.

sudo mkfs.f2fs -fm /dev/XXXX

XXXX이전에 식별한 파티션은 어디에 있습니까 gparted? -m 옵션은 F2FS에게 SMR 드라이브의 차단 영역 기능을 사용하도록 지시하므로 중요합니다. 그것이 없으면 내 경험에 따르면 당신은 지붕널 지옥에서 괴로움을 겪게 될 것입니다.

이 작업이 완료되고 설치되면 드라이브에 쓰기가 매우 일관됩니다. 내 쓰기 속도는 대부분 117MB/s에서 105MB/s 사이입니다. 때때로 몇 초 동안 쓰기 속도가 70-80MB/s로 떨어지곤 했습니다.

나는 SMR 드라이브가 대상 포진이 겹치는 드라이브 영역을 다시 작성하여 따라잡아야 한다고 생각합니다. 다행스럽게도 이런 일이 자주 발생하지는 않습니다. 하지만 (아직) 하드 드라이브의 사용 가능한 공간을 절반도 활용하지 못한다는 점은 인정합니다. 이런 일이 발생하면 shingled 쓰기가 더 자주 발생하여 백업 시간이 더 오래 걸릴 것으로 예상됩니다. 그러나 이제는 플래터의 타일링된 영역을 피하는 데 매우 효과적이어서 속도가 느려지는 예를 많이 찾기가 어렵습니다. 또한 장치의 캡슐화되지 않은 영역을 활용하여 메타데이터(로그)를 저장하는 것으로 나타나며, 이는 귀하가 설명하는 엄청난 속도 저하를 방지합니다.

또한 읽기가 완료되고 명령 프롬프트가 반환된 후 F2FS가 나머지 데이터를 플러시하는 데 약 10초가 걸린다는 사실도 확인했습니다. 데이터 손실을 방지하려면 이 시간 동안 장치를 제거하거나 플러그를 뽑지 않는 것이 중요합니다. 쉘 스크립트를 사용하는 경우 이 점을 염두에 두십시오.

F2FS를 사용한 내 쓰기 속도가 xfs를 사용한 쓰기 속도보다 훨씬 높다는 데 동의하실 것입니다. 또한 이를 달성하기 위해 시간 제한을 변경할 필요도 없었습니다.

Answer