VMware + SAN에 여러 개의 Linux 가상 머신이 있습니다.
무슨 일이에요
SAN(실패한 경로)에 문제가 있어 Linux VM 드라이브에 일정 기간 동안 I/O 오류가 나타납니다. 경로 장애 조치가 완료될 때는 너무 늦습니다.모든 Linux 시스템은 대부분의 드라이브가 더 이상 "신뢰할 수 없다"고 결정하고 읽기 전용 장치로 설정합니다.. 루트 파일 시스템 드라이브도 영향을 받습니다.
내가 시도한 것
mount -o rw,remount /
성공하지 못했습니다.echo running > /sys/block/sda/device/state
성공하지 못했습니다./sys
성공하지 못한 채 해결책을 찾기 위해 애쓰고 있습니다 .
내가 시도하지 않았을 수도 있는 것
blockdev --setrw /dev/sda
드디어...
모든 Linux 가상 머신을 다시 시작해야 했습니다. 윈도우 VM은 좋은데..
VMware의 추가 정보...
문제가 설명되었습니다.여기. VMware에서는 Linux scsi 시간 제한을 늘려서예방하다이 문제가 발생합니다.
여기서 문제가 발생합니다!
하지만,문제가 발생할 때하다결국 이런 일이 발생하면 드라이브를 다시 읽기-쓰기 모드로 되돌릴 수 있는 방법이 있습니까?(SAN이 백업되면)
답변1
여기에서 이 문제가 여러 번 발생했습니다. 일반적으로 네트워크가 장기간 다운되었기 때문입니다. 문제는 파일 시스템이 읽기 전용이라는 것이 아니라 디스크 장치 자체가 읽기 전용으로 표시되어 있다는 것입니다. 재부팅밖에 방법이 없습니다. scsi 시간 초과를 늘리면 경로 장애 조치와 같은 일시적인 오류가 발생합니다. 15분간의 네트워크 중단에는 좋지 않습니다.
답변2
에서 mount
:
errors={continue|remount-ro|panic}
Define the behavior when an error is encountered. (Either
ignore errors and just mark the filesystem erroneous and con‐
tinue, or remount the filesystem read-only, or panic and halt
the system.) The default is set in the filesystem superblock,
and can be changed using tune2fs(8).
continue
따라서 이 옵션을 대신 사용해야 합니다 remount-ro
.
mount -o errors=continue
mount -o remount
답변3
RHEL 시스템에서 연결된 SAN을 다시 시작/재구성할 때 이 문제가 발생했습니다. 나에게 도움이 된 방법은 볼륨 그룹과 LVM을 비활성화한 다음 다시 활성화하는 것이었습니다.
vgchange -a n /vg_group_name
lvchange -a n /lvm_group_name
그런 다음 다시 활성화해야 합니다.
vgchange -a y /vg_group_name
lvchange -a y /lvm_group_name
그런 다음 mount -a
.
답변4
의도적으로 비활성화한 NFS 데이터 저장소에서 실행되는 테스트 가상 머신을 사용하여 테스트 사례를 실행한 후 작동하는 항목을 찾지 못했습니다. 이것블록 개발자명령이 작동하지 않으며 vg /lv 명령은 설치된 루트 /
시스템에서 작동을 거부합니다.
현재로서는 최선의 선택은 errors=panic
다음과 같이 설정 하는 것 같습니다./etc/fstab따라서 가상 머신은 실패합니다.