연결이 끊어졌다가 다시 연결된 mdadm RAID1 디스크가 자동으로 다시 연결 및 재동기화되지 않는 이유는 무엇입니까?

연결이 끊어졌다가 다시 연결된 mdadm RAID1 디스크가 자동으로 다시 연결 및 재동기화되지 않는 이유는 무엇입니까?

나는 다음 테스트를 위해 Hyper-V에서 Debian 9를 사용하고 있습니다. 각각 파티션이 있고 /dev/md0RAID1 /dev/sda1/dev/sdb1. 정의된 루트 EXT4 파일 시스템이 md0제대로 작동합니다.

sdb그런 다음 가상 하드웨어를 제거하여 디스크를 제거하기 위해 컴퓨터를 다시 시작했습니다. 모든 것이 잘 작동합니다. 이제 어레이가 깨끗하지만 성능이 저하되었다는 이메일을 받았습니다.

md0 : active raid1 sda1[0]
      4877312 blocks super 1.2 [2/1] [U_]

알았어, 예상대로야. 다시 연결하고 sdb동일한 디스크 파일을 사용하여 새 가상 디스크를 만든 다음 컴퓨터를 다시 시작했지만 시스템이 디스크를 다시 감지하지 못하는 것 같습니다. 아무것도 변경되지 않았습니다. 어레이에는 여전히 1개의 드라이브가 있으며 깨끗하고 성능이 저하된 상태입니다. mdadm --detail /dev/md0여전히 디스크가 삭제되었다고 보고됩니다.

uuid와 디스크 이름이 일치하므로 다음 부팅 시 디스크가 자동으로 재감지, 재연결 및 재동기화될 것으로 예상됩니다.

디스크를 수동으로 다시 추가하고 mdadm --manage /dev/md0 --add /dev/sdb1시스템이 이를 동기화하자 어레이가 깨끗하게 돌아왔습니다.

이것이 시스템이 작동하는 방식입니까?

mdadm: Found some drive for an array that is already active추신: 시작할 때 수많은 메시지를 받습니다.mdadm: giving up.

답변1

RAID 디스크가 갑자기 사라져(운영 체제에 관한 한) RAID 어레이의 성능이 저하되었다가 다시 나타나는 경우 시스템 관리자가 의도적으로 디스크를 뽑았다가 다시 삽입했기 때문입니까? 아니면 어딘가에 간헐적인 연결이 있을 수도 있습니다. 케이블이 손상되었거나 연결이 느슨할 수도 있습니다.

시스템이 삭제 및 복원이 의도적인 것임을 알 수 있는 방법이 있다면 어떨까요?, 자동으로 픽업될 수 있습니다. 그러나 소프트웨어 RAID에는 그러한 지식이 없으므로 최악의 시나리오를 가정하고 달리 지정하지 않는 한 어떤 이유로 디스크나 연결이 신뢰할 수 없는 것처럼 작동합니다.

하드웨어 RAID 컨트롤러핫 스왑 가능 디스크가 있는 디스크에는 특정 슬롯의 디스크가 물리적으로 제거 및 교체된 시기를 감지하는 추가 회로가 있을 수 있으며 해당 RAID 컨트롤러와 연결된 슬롯의 모든 디스크는 다음의 추가 가정에 따라 항상 RAID 작동으로 간주될 수 있습니다. 디스크.

따라서 디스크가 사라지고 핫 플러그 ​​모니터링 회로에서 디스크가 물리적으로 제거되었음을 나타내면 컨트롤러는 이후에 동일한 슬롯에 삽입된 디스크에 고유한 유형의 RAID 메타데이터가 있는지 확인할 수 있습니다. 메타데이터가 없으면 공장에서 갓 나온 새 디스크일 가능성이 높으며 핫스왑 모니터 회로에 디스크가 완전히 연결되었음을 표시하면 덮어쓸 수 있습니다. 마찬가지로, 메타데이터에 다시 삽입한 후 동일한 디스크라고 표시되면 RAID 그룹을 자동으로 복원할 수 있습니다.

메타데이터가 존재하고 디스크가 한때 속해 있었음을 나타내는 경우다른RAID를 설정할 때 시스템 관리자는 동일한 유형의 RAID 컨트롤러를 사용하여 다른 서버에서 데이터를 복구하도록 설정할 수 있으므로 추가 지침을 기다리는 것이 가장 좋습니다. 관리자는 디스크를 덮어쓸지 아니면 디스크를 가져올지 결정합니다. 다른 RAID 볼륨에 대한 RAID 설정과 현재 데이터가 있습니다.

그러나 디스크가 사라지고 핫 플러그 ​​모니터링 회로가 디스크가 여전히 물리적으로 존재한다고 표시하는 경우 하드웨어 RAID 컨트롤러는 나중에 자체적으로 다시 나타나더라도 결함이 있다고 선언할 충분한 이유가 있습니다.

(중요한 교훈: 오류가 발생한 서버의 데이터를 복구하기 위해 하드웨어 RAID 디스크를 오류가 발생한 서버에서 다른 유사한 서버로 이동하는 경우 연결하기 전에 수신 서버에 저하된 상태의 RAID 세트가 없는지 확인하십시오. 데이터의 유일한 복사본에 몇 가지 키를 포함합니다.

관련 정보