디스크가 천천히 실패하기 시작하면 다중 경로가 실패하기 시작하고 복구 경로가 실패하기 시작하며 이것이 영원히 지속됩니다. (FC 네트워크가 아닌 SAS-JBOD와 함께 LSI-3008HBA 카드를 사용하고 있습니다)
정보;
Sep 13 11:20:17 DEV2 kernel: sd 0:0:190:0: attempting task abort! scmd(ffff88110e632948)
Sep 13 11:20:17 DEV2 kernel: sd 0:0:190:0: [sdft] tag#3 CDB: opcode=0x0 00 00 00 00 00 00
Sep 13 11:20:17 DEV2 kernel: scsi target0:0:190: handle(0x0037), sas_address(0x5000c50093d4e7c6), phy(38)
Sep 13 11:20:17 DEV2 kernel: scsi target0:0:190: enclosure_logical_id(0x500304800929ec7f), slot(37)
Sep 13 11:20:17 DEV2 kernel: scsi target0:0:190: enclosure level(0x0001),connector name(1 )
Sep 13 11:20:17 DEV2 kernel: sd 0:0:190:0: task abort: SUCCESS scmd(ffff88110e632948)
Sep 13 11:20:18 DEV2 kernel: device-mapper: multipath: Failing path 130:240.
Sep 13 11:25:34 DEV2 kernel: device-mapper: multipath: Reinstating path 130:240.
보시다시피 커널은 작업을 중단했으며 다중 경로 지정이 실패한 후입니다. 그래서 저는 Multipath에 "경로를 복원하지 마세요"라고 말함으로써 이 문제를 제거하고 싶습니다.
이 방법은 좀비 디스크를 죽은 상태로 유지합니다.
어떻게 해야 하나요?
답변1
다중 경로가 경로가 유효한지 여부를 어떻게 결정하는지 알아야 합니다. 당신이 보면다중 경로 구성 파일선택적인 path_checker가 있고 option
그 목록을 볼 수 있습니다(기본값은 readsector0
). 또 다른 방법은 경로가 그룹화되도록 경로 우선순위를 개발하는 것입니다. 장애 조치를 비활성화하면 긴급 상황이 아닌 이상 사용되지 않습니다. ~에 따르면https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/6/html/storage_administration_guide/removing-path-to-storage-device쌍에 대한 수동 참조를 제거한 후 sdft
다음을 사용할 수 있습니다(단, 제공한 대소문자에 맞게 교체) sdft
.sda
경로를 오프라인으로 전환하는 데 사용됩니다
echo offline > /sys/block/sda/device/state
.이로 인해 이 경로의 장치로 전송된 모든 후속 I/O가 즉시 실패하게 됩니다.장치 매퍼 다중 경로장치의 나머지 경로는 계속 사용됩니다.