소프트웨어 패리티-RAID(예: RAID5)의 장점과 단점

소프트웨어 패리티-RAID(예: RAID5)의 장점과 단점

최근 누군가가 비휘발성 캐시가 없는 패리티 RAID와 관련된 몇 가지 문제에 대해 이야기했습니다. 더 비싼 하드웨어 컨트롤러에는 정전 시 쓰기를 완료할 수 있는 배터리 지원 캐시가 있습니다. 일부 사람들은 그러한 장애가 어레이 성능 저하와 결합되어 전체 파일 시스템을 파괴할 수 있다고 말합니다.다른 사람들은 질문이 오래되었거나 잘못 이해되었다고 주장합니다..

불행히도 아무도 구체적인 참조를 제공하지 않으며 검색하는 사람도 없습니다.md RAID 및 비휘발성 캐시, 또는비트맵 캐시md-RAID5가 권장되는지에 대한 확실한 답변을 제공하십시오.

관련 정보가 있나요?

답변1

Linux용 소프트웨어 RAID는 BBU가 없고 쓰기 저장 캐시가 활성화된 하드웨어 RAID 카드만큼 안정적이라고 생각합니다. 결국, 소프트웨어 RAID 시스템의 커밋되지 않은 데이터는 배터리 백업이 없는 후기입 캐시 형태인 커널의 버퍼 캐시에 상주합니다.

내가 사용한 모든 하드웨어 RAID-5 카드는 BBU 없이 다시 쓰기 캐싱을 활성화할 수 있으므로 소프트웨어 RAID-5는 특정 위험 허용 범위를 가진 사람에게 잘 작동할 것으로 기대합니다.

전쟁 이야기 보기:

그렇긴 하지만, 후기입 캐싱을 활성화했음에도 불구하고 RAID-5 카드에 BBU가 설치되지 않아 개인적으로 심각한 데이터 손실을 경험했습니다. (UPS도 없습니다. 나에게 소리지르지 마세요. 내 전화가 아닙니다.)

제가 휴가를 가는 동안 생산 시스템 중 하나가 정전 후 복구할 수 없어 상사가 당황해서 저에게 전화를 했습니다. 그가 시도할 수 있는 것은 아무것도 남지 않았습니다. 길가에 차를 세우고 노트북을 꺼내고 휴대폰에서 WiFi 테더링을 켜고 ssh영향을 받은 시스템에 들어가서 가족이 나와 함께 길가에 앉아 있는 동안 문제를 해결해야 했습니다. 백업이 완료되었습니다. 액세스한 데이터베이스 테이블을 복원합니다. (우리는 휴대폰 수신이 끊길 때까지 약 1마일 정도 떨어져 있었습니다.)

그럼 말해 보세요: RAID 카드 + BBU에 얼마를 지출할 의향이 있습니까?지금?

답변2

경고 사항: RAID-5/6 쓰기 작업은 어레이 성능이 저하될 때 많은 CPU 시간을 소비할 수 있습니다. 디스크 장애가 발생했을 때 서버가 이미 꽉 차 있다면 서버는 무응답 상태에 빠질 수 있습니다. 하드웨어 RAID 컨트롤러에서는 이 문제가 발생하지 않습니다. 따라서 프로덕션 서버에서는 소프트웨어 RAID-5/6을 사용하지 않는 것이 좋습니다. 워크스테이션이나 부하가 적은 서버의 경우에는 괜찮습니다.

답변3

SW RAID에는 오류 모드가 있습니다. 쓰기 중에 서버에 오류가 발생하면 스트라이프가 손상될 수 있습니다. BBU가 포함된 HW RAID 컨트롤러는 그다지 비싸지 않으며 디스크를 재부팅할 수 있을 때까지 더티 블록을 유지합니다.

캐시의 BBU는아니요정전 시 쓰기가 보장됩니다(즉, 디스크에 전원이 공급되지 않음). 디스크를 재부팅할 수 있을 때까지 며칠 동안 캐시에 전원을 공급합니다. 그런 다음 컨트롤러는 모든 더티 버퍼를 디스크로 플러시합니다.

소프트웨어 및 하드웨어 RAID-5에 대한 몇 가지 참고 사항

  1. I/O 차단과 함께 연속 쓰기 캐싱을 사용하는 경우 모든 I/O가 완료될 때까지 호출이 반환되지 않으므로 SW RAID-5 볼륨에 대한 쓰기가 느려질 수 있습니다. BBWC가 포함된 HW RAID 컨트롤러는 이를 크게 최적화할 수 있으므로 훨씬 더 나은 성능을 볼 수 있습니다.

  2. 지난번 확인했을 때 SW RAID 볼륨에서는 직접 I/O(즉, 제로 복사 DMA)를 수행할 수 없었습니다. 이는 변경되었을 수 있으며 실제로는 원시 파티션을 사용하는 데이터베이스 관리자와 같은 애플리케이션에만 관련됩니다.

  3. 최신 SAS RAID 컨트롤러는 특히 더 큰(예: 256kb) 스트라이프 크기로 포맷된 경우 디스크 어레이에서 초당 1GB 이상의 데이터를 끌어오거나 밀어넣을 수 있습니다. 심지어 나이든 사람도 벤치마킹했는데Adaptec ASR-2200s속도는 호스트의 CPU 로드가 거의 없는 상태에서 두 scsi 채널이 모두 600MB/sec+(10x 15k 디스크)로 거의 포화되었음을 보여줍니다. 최신 시스템에서도 많은 CPU 로드 없이(전혀) 소프트웨어 RAID-5에서 이를 얻을 수 있는지 확신할 수 없습니다. 아마 빨리 읽어보실 수 있을 거예요.

  4. 부팅 HW RAID 볼륨 구성은 간단합니다. RAID 볼륨은 운영 체제에 투명합니다.

Adaptec과 같은 1차 공급업체의 저가형 RAID 컨트롤러는 소매 가격이 비싸지 않으며 eBay에서 저렴하게 구입할 수 있습니다. 하지만 중고품을 구매하는 경우에는 1차 공급업체를 선택하고 모델 번호를 알고 해당 웹사이트에서 드라이버 가용성을 확인하세요.

편집하다:@psusi의 의견에 따르면 fakeraid(드라이버에 숨겨진 투명 SW RAID) 컨트롤러를 사용하고 있지 않은지 확인하세요. 하지만 더 큰 브랜드(Adaptec, 3Ware 또는 LSI)에서 제공하는 대부분의 제품은 fakeraid 장치가 아닙니다. BBU를 받을 수 있는 모든 것은 가짜 지원이 아닙니다.

답변4

Linux mdadm 소프트웨어 RAID는 배터리 지원 캐시를 사용하는 하드웨어 RAID만큼 안정적으로 설계되었습니다. 단일 디스크의 갑작스러운 정전 문제를 제외하고는 갑작스러운 정전의 문제는 없습니다.

정전 후 시스템이 다시 작동되면 어레이가 다시 동기화됩니다. 이는 기본적으로 정전 전에 기록된 데이터와 일치하도록 패리티를 다시 계산하는 것을 의미합니다. 이 작업에는 시간이 좀 걸리지만 실제로는 큰 문제가 아닙니다. 쓰기 비트맵을 활성화하면 재동기화 시간을 크게 줄일 수 있습니다.

관련 정보