RAID5를 사용하는 CentOS 서버가 있습니다. RAID5가 다시 동기화될 때마다 서버가 정지됩니다. 호스팅 회사는 RAID5가 자체적으로 재동기화할 수 있도록 httpd 서비스를 중지했습니다. 이 프로세스는 최대 3~4시간이 걸릴 수 있습니다.
문제가 계속 반복되어 호스팅 회사에서 서버 하드웨어를 교체했고 저는 새 하드웨어로 마이그레이션했습니다. 새 서버에서 여전히 이 문제가 발생합니다.
RAID5에서는 이것이 정상입니까? 이 문제를 어떻게 영구적으로 해결할 수 있습니까? RAID5는 내 서버를 다시 동기화하려고 할 때마다 과부하가 걸려 내 웹 사이트에 액세스할 수 없게 된다면 좋지 않습니다.
이번 재난에 대한 해결책을 제안해 주시면 감사하겠습니다.
이것은 /proc/mdstat 보고서입니다:
root@host [~]# watch 'cat /proc/mdstat'
Every 2.0s: cat /proc/mdstat Mon May 9 01:25:30 2011
Personalities : [raid1]
md0 : active raid1 xvda1[0] xvdb1[1]
104320 blocks [2/2] [UU]
md1 : active raid1 xvda2[0] xvdb2[1]
2096384 blocks [2/2] [UU]
md2 : active raid1 xvda5[0] xvdb5[1]
484086528 blocks [2/2] [UU]
[=====>...............] resync = 29.5% (142978880/484086528) finish=77.7m
in speed=73108K/sec
unused devices: <none>
답변1
RAID는 서버 충돌 또는 고장난 디스크 교체 후에만 다시 동기화해야 합니다. 항상 UPS를 사용하고 배터리가 부족할 때 시스템이 종료되도록 설정하여 다시 시작할 때 재동기화가 필요하지 않도록 하는 것이 좋습니다. NUT 또는 acpupsd는 많은 UPS와 통신할 수 있으며 UPS의 전원이 꺼지기 전에 종료를 시작할 수 있습니다. 충돌이 발생하지 않은 상태에서 서버가 다시 동기화되면 하드웨어 문제가 있을 수 있습니다. /var/log/kern.log
또는 를 실행하여 커널 로그를 확인하십시오 dmesg
. 또한 mdadm
관리자에게 이메일을 보내도록 설정 하고 smartd
모든 디스크 드라이브에서 실행하는 것을 권장합니다. 마찬가지로 관리자에게 이메일을 보내도록 설정하는 것이 좋습니다. 디스크 오류가 발생하기 약 절반 정도 전에 이메일을 받습니다. 피할 수 없는 충돌이 발생하면 RAID에서 쓰기 전용 비트맵을 활성화해야 합니다. 이는 디스크 쓰기 위치의 로그를 유지하고 재부팅 시 전체 재동기화를 방지합니다. 활성화:
mdadm -G /dev/md0 --bitmap=internal