다음과 같은 기본 스택이 있는 ext4 파티션이 있습니다.
- sda1과 sdb1이 함께 RAID1을 형성하여 md0을 생성합니다.
- md0은 LUKS로 암호화되어 md0_crypt를 생성합니다.
- md0_crypt 위는 /home/media 아래에 설치된 단일 LVM 볼륨 mv0_vg_media입니다.
실행할 때 cp /home/media/hierarchy/photo.jpg /tmp
IO 오류가 발생합니다(그러나 수만 개 파일 중 약 20개 파일에만 해당).
그러나 문제를 디버깅하려고 하면 다음과 같습니다.
- IO 오류가 발생하면 dmesg와 syslog는 모두 깨끗한 상태로 유지됩니다. (편집: 설명: 이는
--follow
읽기 오류가 발생할 때 로그 통과 옵션이 활성화되어 있어도 디스크 관련 출력이 dmesg 또는 syslog에 기록되지 않음을 의미합니다 .) - sda 및 sdb의 불량 블록에는 오류가 표시되지 않습니다.
- fsck on은
/dev/mapper/md0_vg_media
"더 좁아질 수 있습니다. 무시하세요." 경고만 출력하지만 오류는 없으며 자동 수정 옵션은 아무 것도 수정하지 않습니다.
혼란스러워요. 파일을 삭제하고 다시 동기화할 수 있지만 문제가 무엇인지 정확히 알지 못한다면 이는 좋지 않은 생각입니다.
어떻게 더 디버깅할 수 있나요?
편집하다:
의견과 추가 연구를 바탕으로 다음과 같은 결과를 얻었습니다.
mdadm --examine /dev/sda
(sdb와 동일)은 다음을 반환합니다./dev/sda: MBR Magic : aa55 Partition[0] : 3907029167 sectors at 1 (type ee)
mdadm --examine-badblocks /dev/sda
(sdb와 동일)은 다음을 반환합니다.mdadm: mbr metadata does not support badblocks
cat /sys/block/md0/md/mismatch_cnt
0
값 (0) 포함echo 'check' > /sys/block/md0/md/sync_action
점검이 수행되었지만 오류가 발견되지 않았습니다. Dmesg에는 두 개의 항목이 있으며[734796.807172] md: data-check of RAID array md0
그 뒤에는 다음이 옵니다.[754370.977181] md: md0: data-check done.