raid5 어레이 복구 도움말

Question 1

당신은 말한다:

재구축 중에 어레이의 다른 드라이브 중 하나가 떨어지는 시간의 약 60%

이는 RAID-5의 알려진 위험이며 오늘날 RAID-5를 사용하기에 안전하지 않은 것으로 간주되는 이유 중 하나입니다. RAID-5 어레이의 두 드라이브가 동시에 실패하면 데이터를 복구할 수 없습니다. 불행하게도 드라이브 하나에 장애가 발생한 어레이를 재구축하면 다른 드라이브에 충분한 스트레스가 가해져 재구축 중에 다른 드라이브에 장애가 발생할 가능성이 크게 높아질 수 있습니다. 재구축 시간이 길어질수록(즉, 드라이브가 더 크고 다른 실제 작업을 수행하는 데 더 바빠질수록) 이런 일이 발생할 가능성은 더 높아집니다.

이는 RAID 어레이가 수년간 사용되었고 드라이브가 예상 수명에 가까워지고 있는 경우 특히 그렇습니다. 또는 어레이의 모든 드라이브가 동일한 생산에서 실행되고 유사한 결함("잘못된 배치"인 경우) 또는 유사한 기대 수명이 있는 경우.

4-디스크 RAID-5 어레이(즉, 스트라이프 데이터용 디스크 3개, 패리티용 디스크 1개)의 드라이브 전체에 데이터가 스트라이프되는 방식으로 인해 두 드라이브에 장애가 발생하면각 파일의 최소 1/3이 손실됩니다.. 이는 하나 이상의 드라이브가 실패할 때 RAID-0 스트라이핑에서 발생하는 것과 유사합니다. 즉, 실패한 드라이브에 있던 스트라이프 부분이 사라집니다.

RAID-6은 모든 데이터가 손실되기 전에 두 개의 드라이브가 실패할 수 있도록 허용하여 이를 약간 개선하지만, 세 개의 드라이브가 동시에 실패하면 동일한 문제가 발생합니다.

RAID-1은 하나의 드라이브에 오류가 발생하면 다른 드라이브(또는 여러 드라이브에 미러링된 경우 다른 드라이브)에서 데이터를 검색할 수 있으므로 더 안전합니다. 미러 세트의 모든 드라이브에 오류가 발생하면 모든 것을 잃게 됩니다.

RAID-10은 RAID-1과 유사합니다. 미러 세트의 모든 드라이브가 동시에 종료되면 취약한 상태로 유지됩니다. RAID-10은 두 번의 드라이브 오류에도 살아남을 수 있지만오직실패한 드라이브가 동일한 미러 세트에 없는 경우. 예를 들어 드라이브 a, b, c, d와 두 개의 미러링된 쌍(a+b 및 c+d)이 있고 다른 쌍의 두 드라이브 조합(예: a+c, a+d, b +c 또는 b+d)가 실패하면 데이터가 손실되지 않을 수 있지만, a+b 또는 c+d가 실패하면 데이터가 손실됩니다.

RAID-1 및 RAID-10의 경우 각 미러 세트에 더 많은 드라이브를 포함하면 위험을 줄일 수 있습니다. 예를 들어, 6개 드라이브 RAID-10은 a+b, c+d, e+f(미러링된 쌍 3개, 총 용량 = 드라이브 수/2) 또는 a+b+c 및 d+e+로 구성할 수 있습니다. f(미러 트리플릿 2개, 총 용량 = 드라이브 수 / 3)

따라서 모든 RAID 레벨에는 치명적인 데이터 손실을 초래할 수 있는 오류 모드가 있습니다.

이 모든 것에서 기억해야 할 핵심 사항은 다음과 같습니다.

RAID는 정기 백업을 대체하지 않습니다.

Answer

당신은 말한다:

재구축 중에 어레이의 다른 드라이브 중 하나가 떨어지는 시간의 약 60%

이는 RAID-5의 알려진 위험이며 오늘날 RAID-5를 사용하기에 안전하지 않은 것으로 간주되는 이유 중 하나입니다. RAID-5 어레이의 두 드라이브가 동시에 실패하면 데이터를 복구할 수 없습니다. 불행하게도 드라이브 하나에 장애가 발생한 어레이를 재구축하면 다른 드라이브에 충분한 스트레스가 가해져 재구축 중에 다른 드라이브에 장애가 발생할 가능성이 크게 높아질 수 있습니다. 재구축 시간이 길어질수록(즉, 드라이브가 더 크고 다른 실제 작업을 수행하는 데 더 바빠질수록) 이런 일이 발생할 가능성은 더 높아집니다.

이는 RAID 어레이가 수년간 사용되었고 드라이브가 예상 수명에 가까워지고 있는 경우 특히 그렇습니다. 또는 어레이의 모든 드라이브가 동일한 생산에서 실행되고 유사한 결함("잘못된 배치"인 경우) 또는 유사한 기대 수명이 있는 경우.

4-디스크 RAID-5 어레이(즉, 스트라이프 데이터용 디스크 3개, 패리티용 디스크 1개)의 드라이브 전체에 데이터가 스트라이프되는 방식으로 인해 두 드라이브에 장애가 발생하면각 파일의 최소 1/3이 손실됩니다.. 이는 하나 이상의 드라이브가 실패할 때 RAID-0 스트라이핑에서 발생하는 것과 유사합니다. 즉, 실패한 드라이브에 있던 스트라이프 부분이 사라집니다.

RAID-6은 모든 데이터가 손실되기 전에 두 개의 드라이브가 실패할 수 있도록 허용하여 이를 약간 개선하지만, 세 개의 드라이브가 동시에 실패하면 동일한 문제가 발생합니다.

RAID-1은 하나의 드라이브에 오류가 발생하면 다른 드라이브(또는 여러 드라이브에 미러링된 경우 다른 드라이브)에서 데이터를 검색할 수 있으므로 더 안전합니다. 미러 세트의 모든 드라이브에 오류가 발생하면 모든 것을 잃게 됩니다.

RAID-10은 RAID-1과 유사합니다. 미러 세트의 모든 드라이브가 동시에 종료되면 취약한 상태로 유지됩니다. RAID-10은 두 번의 드라이브 오류에도 살아남을 수 있지만오직실패한 드라이브가 동일한 미러 세트에 없는 경우. 예를 들어 드라이브 a, b, c, d와 두 개의 미러링된 쌍(a+b 및 c+d)이 있고 다른 쌍의 두 드라이브 조합(예: a+c, a+d, b +c 또는 b+d)가 실패하면 데이터가 손실되지 않을 수 있지만, a+b 또는 c+d가 실패하면 데이터가 손실됩니다.

RAID-1 및 RAID-10의 경우 각 미러 세트에 더 많은 드라이브를 포함하면 위험을 줄일 수 있습니다. 예를 들어, 6개 드라이브 RAID-10은 a+b, c+d, e+f(미러링된 쌍 3개, 총 용량 = 드라이브 수/2) 또는 a+b+c 및 d+e+로 구성할 수 있습니다. f(미러 트리플릿 2개, 총 용량 = 드라이브 수 / 3)

따라서 모든 RAID 레벨에는 치명적인 데이터 손실을 초래할 수 있는 오류 모드가 있습니다.

이 모든 것에서 기억해야 할 핵심 사항은 다음과 같습니다.

RAID는 정기 백업을 대체하지 않습니다.

Question 2

그래서 몇 가지를 시도했습니다. 먼저, 오늘 아침에 컴퓨터를 다시 시작한 후 공격을 중단했습니다.

jake@ubuntu-box:~$ sudo mdadm -S /dev/md1
mdadm: stopped /dev/md1

그런 다음 배열의 uuid를 사용하여 어셈블하려고 합니다.

jake@ubuntu-box:~$ sudo mdadm --assemble /dev/md1 --
uuid=e7ab07c3:b9ffa9ae:377e3cd3:a8ece374
mdadm: /dev/md1 assembled from 1 drive - not enough to start the array.

글쎄, 그게 바로 내가 기대했던 것입니다. 그럼 강제로 시도해 봅시다:

jake@ubuntu-box:~$ sudo mdadm --assemble /dev/md1 --force --
uuid=e7ab07c3:b9ffa9ae:377e3cd3:a8ece374
mdadm: forcing event count in /dev/sdb2(1) from 238868 upto 239374
mdadm: forcing event count in /dev/sda2(0) from 20364 upto 239374
mdadm: /dev/md1 assembled from 3 drives - not enough to start the array.

흠..그거~해야 한다이미 직장에 있어요. RAID의 개별 파티션을 호출하여 수동으로 다시 조립해 보겠습니다.

jake@ubuntu-box:~$ sudo mdadm --assemble /dev/md1 /dev/sda2 /dev/sdb2 
/dev/sdc2 /dev/sdd2 --force
mdadm: /dev/md1 has been started with 3 drives (out of 4).

빙고! 드라이브 4개 중 3개로 시작하는 것 같습니다. 이제 내 데이터에 액세스할 수 있다는 의미입니다! 웃으면서 세부 사항을 확인해 보겠습니다.

jake@ubuntu-box:~$ sudo mdadm --detail /dev/md1/dev/md1:
        Version : 0.90
  Creation Time : Thu Aug 18 14:30:36 2011
     Raid Level : raid5
     Array Size : 2924400000 (2788.93 GiB 2994.59 GB)
  Used Dev Size : 974800000 (929.64 GiB 998.20 GB)
   Raid Devices : 4
  Total Devices : 3
Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Tue Mar 13 14:00:33 2018
          State : clean, degraded 
 Active Devices : 3
Working Devices : 3
 Failed Devices : 0
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 64K

           UUID : e7ab07c3:b9ffa9ae:377e3cd3:a8ece374
         Events : 0.239374

    Number   Major   Minor   RaidDevice State
       0       8        2        0      active sync   /dev/sda2
       1       8       18        1      active sync   /dev/sdb2
       2       8       34        2      active sync   /dev/sdc2
       6       0        0        6      removed

우리가 말하는 동안 데이터를 복사하고 있습니다. 따라서 데이터를 복구할 수 없는 것은 아닙니다. 습격을 강제로 재편성하는 올바른 명령을 아는 것이 중요합니다.

Answer