어떤 뒷이야기가 있는지 잘 모르겠어서...
저는 서아프리카의 한 학교에서 컴퓨터 수업, ESL 및 기타 몇 가지 수업을 가르쳤을 때 파일 서버를 설치했습니다. 매일같이 사용량이 많은 서버임에도 불구하고 몇 년 동안 누구도 적극적으로 서버를 관리하지 않았습니다. 나는 그것이 CentOS 6.X(아마도 0)라고 확신합니다. 디스크 시스템은 5개의 WD Black 2TB 드라이브로 구성됩니다. 파티션은 다음과 같습니다:
1) 부팅 파티션, mdadm RAID 1, 활성 디스크 2개, 스페어 3개 2) 스왑, RAID 1, 활성 디스크 2개, 스페어 3개 3) / 파티션, RAID 1, 활성 디스크 2개, 스페어 3개 4- 8) 다중 파티션 스토리지 FS, 모두 RAID 5, 활성 디스크 4개, 예비 디스크 1개 - 상단에서 LVM 실행
학교의 전력은 매우 불안정하며 최근까지 APC 랙마운트 장비는 완벽하게 작동했습니다. 그러나 배터리는 최근 품질이 낮은 배터리(여기에서 사용 가능)로 교체되어 현재 불안정합니다. 서버 MB(3210SHLX)의 CMOS 배터리도 방전되었습니다.
아니면 불안정한 권력 때문에 흑인 다섯 명 중 한 명이 죽었을 수도 있다. 괜찮아요. 나는 선반에서 예비 파티션을 교체하고 fdisk'ing을 시작하고 새 파티션을 각 RAID 어레이로 읽어 들였습니다. 재구축은 순조롭게 진행되었으며 이 구성은 며칠 동안 제대로 작동했습니다.
일주일 후에 전화를 받았을 때 상자가 시작되지 않았습니다. 이 시점에서 저는 CMOS 배터리가 방전되었음을 발견했으며 BIOS가 AHCI 모드가 아닌 IDE로 기본 설정되어 일부 드라이브만 노출되어 RAID 어레이가 다운그레이드 모드에서 설치를 시도했지만 실패하게 된다는 것을 깨달았습니다.
systemrescueCD를 사용하여 어레이를 다시 모으고 다시 동기화했습니다. / 장치를 제외한 모든 것입니다. 모든 구성원 파티션에 대한 mdadm -E(sd[abcde]2)는 두 가지 흥미로운 사항을 보여줍니다. 모든 파티션의 UUID는 0이고 목록 맨 아래에는 모두 서로를 배열의 구성원으로 표시하지만 5개 디스크는 모두 다음과 같이 표시됩니다. 예비 디스크.
그래서 재부팅되기를 바라면서 베인에 어레이를 재조립하려고 시도했지만 (UUID가 0이 되었기 때문에 가정) 재조립에 실패했습니다.
어딘가에서 찾은 다른 페이지의 조언에 따라 sde2와 누락된 다른 디스크만 사용하여 RAID 1 어레이를 만든 다음 장치를 마운트해 보았습니다. 이렇게 하면 NTFS 마운트 오류가 발생합니다(기본 파티션이 분명히 ext(3?)임에도 불구하고). sde가 최근에 교체한 디스크였기 때문에 우연일 수도 있다고 생각했고, 예비 디스크였다면 데이터가 동기화되지 않았습니다. 이를 달성하기 위해 sdd 및 sdc에서도 동일한 작업을 시도했지만 동일한 오류가 발생했습니다.
그때 나는 그만두기로 결심했습니다. 아마도 더 빨리 했어야 했을 것입니다. 이제 sda2와 sdb2라는 두 개의 파티션이 그대로 남아 있고, 이 두 파티션 중 하나가 어레이가 해제되기 전에 활성 멤버 중 하나였기를 바랍니다(여전히 이 부분이 어떻게 발생했는지는 알 수 없음).
이것은 OS 파티션이고 새로 설치하면 만족할 것입니다. 하지만 저는 바보이고 conf 파일이나 samba의 secrets.tdb 파일을 백업하지 않았습니다. 그리고 이것은 40개의 클라이언트가 있는 도메인 컨트롤러입니다. 따라서 재설치 및 손실을 위해서는 해당 시스템의 이미지를 재구축하고 새 도메인에 다시 가입해야 합니다. 내가 그 문제를 해결할 수 있다면 차라리하지 않을 것입니다.
이제 다른 모든 파티션은 복구 작업에서 제대로 작동하고 있으며 예비 파티션과 완전히 동기화되어 정상적으로 실행됩니다.
두 개의 원래 파티션에서 / 파티션을 복구하려고 할 때 다음에 수행할 작업에 대한 조언을 듣고 싶습니다. 그 중 하나는 배열 데이터의 복사본을 포함하기를 바랍니다. 예전 카피도 괜찮네요.
미리 감사드립니다!