자동 디스크 오류 및 Linux 스와핑의 안정성

Question 1

우리는 교환에서 검색된 데이터의 무결성을 신뢰합니다.스토리지 하드웨어체크섬, CRC 등이 있습니다.

위 댓글 중 하나에서 다음과 같이 말씀하셨습니다.

예, 하지만 디스크 자체 외부의 비트 플립은 방지할 수 없습니다.

여기서 "It"은 디스크의 체크섬을 나타냅니다.

이는 사실이지만,SATA는 32비트 CRC를 사용합니다.명령 및 데이터에 사용됩니다. 따라서 디스크와 SATA 컨트롤러 사이의 데이터가 감지되지 않은 채 손상될 가능성은 40억분의 1입니다. 즉, 지속적인 오류 소스는 전송된 125MiB마다 오류를 일으킬 수 있지만, 우주선과 같은 희귀한 무작위 오류 소스는 극히 낮은 비율로 감지할 수 없는 오류를 일으킬 수 있습니다.

또한 소스에서 전송된 125MiB당 오류 1개에 가까운 비율로 감지되지 않은 오류가 발생하는 경우 성능이 저하된다는 점을 인식하세요.나쁜수가 많기 때문에감지됨재전송이 필요한 오류입니다. 모니터링 및 로깅을 통해 적시에 문제를 경고하여 감지되지 않은 손상을 방지할 수 있습니다.

저장 미디어의 체크섬과 관련하여 모든 SATA(및 그 이전의 PATA) 디스크는 일종의 섹터별 체크섬을 사용합니다. "엔터프라이즈" 하드 드라이브의 특징 중 하나는 보호되는 섹터가 더 크다는 것입니다.추가 데이터 무결성 기능, 감지되지 않은 오류가 발생할 가능성이 크게 줄어듭니다.

이러한 조치가 없으면 의미가 없습니다.예비 섹터 풀모든 하드 드라이브: 드라이브 자체는 불량 섹터를 감지할 수 없으므로 새 섹터를 교체할 수 없습니다.

다른 댓글에서는 다음과 같이 질문하셨습니다.

SATA가 그렇게 신뢰할 수 있다면 왜 ZFS, btrfs, ReFS 등과 같은 체크섬 파일 시스템이 있습니까?

일반적으로 우리는 장기 저장 데이터의 교환을 요구하지 않습니다. 스왑 저장 용량 한도는 시스템 전체에 적용됩니다.가동 시간, 시스템의 가상 메모리 시스템을 통과하는 대부분의 데이터는 수명이 짧은 프로세스에 속하기 때문에 스왑에 있는 대부분의 데이터는 오래 지속되지 않습니다.

게다가 코어와 코어 실행 빈도가 증가함에 따라 가동 시간은 일반적으로 수년에 걸쳐 감소했습니다.libc업데이트, 가상화, 클라우드 아키텍처 등

또한 스왑에 있는 대부분의 데이터는 기본 RAM 자체를 소모하지 않기 때문에 잘 관리되는 시스템에서는 본질적으로 사용되지 않습니다. 그러한 시스템에서 교환으로 끝나는 유일한 것은페이지이 프로그램은 거의 사용되지 않습니다. 이것은 당신이 생각하는 것보다 더 일반적입니다. 프로그램이 링크하는 대부분의 동적 라이브러리에는 프로그램에서 사용하지 않는 루틴이 포함되어 있습니다.동적 링커. 운영 체제는 라이브러리에 있는 프로그램 텍스트 중 일부를 사용하지 않는다는 사실을 발견하면 이를 교체하여 프로그램 코드와 데이터를 위한 공간을 확보합니다.예사용. 이렇게 교체된 메모리 페이지가 손상되면 누가 알겠습니까?

ZFS와 달리 우리는 데이터가 시스템의 현재 가동 시간 이후뿐만 아니라 스토리지 시스템을 구성하는 개별 스토리지 장치의 수명을 넘어 지속되도록 데이터를 지속적으로 저장하기를 원합니다. ZFS 해결과 같은 문제는 교환으로 해결된 문제보다 약 2배 더 긴 시간 규모를 갖습니다. 따라서 ZFS에 대한 손상 감지 요구 사항은 Linux 스왑 영역보다 훨씬 높습니다.

ZFS 등은 또 다른 주요 방식으로 스왑과 다릅니다. 스왑 파일 시스템을 함께 RAID하지 않습니다. 언제다중 스위칭 장치기계에 사용되며,JBODRAID-0 이상과 달리 구성표입니다. (예를 들어, macOS의체인 교환 파일 구성표, 리눅스swapon등) 스왑 장치는 독립적이고 RAID처럼 서로 종속되지 않으므로 많은 체크섬이 필요하지 않습니다. 스왑 장치를 교체할 때 교체 장치에서 실행되어야 하는 데이터에 대해 다른 상호 의존적인 스왑 장치를 찾을 필요가 없기 때문입니다. 장치 . ZFS 용어에서는 다른 저장 장치의 중복 복사본에서 스왑 장치를 다시 동기화하지 않습니다.

이 모든 것은 안정적인 스위칭 장치를 사용해야 함을 의미합니다. 한번은 실패한 ZFS 풀을 구하기 위해 20달러짜리 외부 USB HDD 인클로저를 사용한 적이 있는데, 인클로저 자체가 신뢰할 수 없고 프로세스에서 자체 오류가 발생한다는 사실을 발견했습니다. ZFS의 강력한 체크섬이 나를 구해주었습니다. 파일을 교환하면 저장 매체를 그렇게 거칠게 다룰 수 없습니다. 스왑 장치가 수명을 다하고 125MiB 전송마다 감지할 수 없는 오류가 주입되는 최악의 시나리오에 접근하는 경우 가능한 한 빨리 교체하면 됩니다.

이 질문에 대한 편집증의 전반적인 감각은 예를 들어 설명됩니다.비잔틴 장군 문제. 주의 깊게 읽고, 컴퓨터 과학 커뮤니티에 문제를 설명하는 학술 논문의 1982년 날짜를 고려하고, 2019년에 문제에 대한 새로운 생각이 있는지 결정하십시오. 그렇지 않다면 아마도 그럴 것이다.사용이 기술은 비잔틴 장군 문제를 이해하고 있는 컴퓨터 과학 졸업생 30명에 의해 설계되었습니다.

이것은 진부한 표현입니다. 컴퓨터 과학 저널에서 다루지 않은 아이디어, 반대, 해결책이 떠오르지 않을 수도 있습니다.

SATA는 확실히 완전히 신뢰할 수는 없지만 학계나 커널 개발 팀에 합류할 계획이 없다면 기존 기술에 실질적인 기여를 할 수 없습니다. 이미 알고 있듯이 이러한 문제는 이미 매우 잘 해결되었습니다. ZFS, btrfs, ReFS... 운영 체제 사용자로서 운영 체제 작성자가 이러한 문제를 해결하고 있다는 것을 신뢰해야 합니다. 비잔틴 장군에 대해 알아보세요.

이것은현재는 실용적이지 않음스왑 파일을 ZFS 또는 Btrfs에 넣습니다. 그러나 위의 내용으로 안심할 수 없다면 최소한 xfs 또는 ext4에 넣을 수 있습니다. 이는 전용 스왑 파티션을 사용하는 것보다 낫습니다.

Answer