내 RAID를 손상시키는 요인이 무엇인지 어떻게 알 수 있나요?

내 RAID를 손상시키는 요인이 무엇인지 어떻게 알 수 있나요?

SSD와 3개의 1TB WD HDD가 포함된 x86_64 Ubuntu 17.10(바닐라 4.13 커널)을 설치했습니다. 각 HDD에는 1.45TB RAID5 어레이용 750GB 파티션이 있습니다. SSD /에 데이터가 있고 RAID 어레이에 LVM 정의가 있는데, /home.

Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md0 : active raid5 sdc1[3] sdd1[1] sdb1[0]
      1572601856 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
      [====>................]  resync = 21.3% (168261416/786300928) finish=64.7min speed=159157K/sec
      bitmap: 6/6 pages [24KB], 65536KB chunk

크리스마스 무렵에 컴퓨터를 반복적으로 켜서 다음과 같은 사실을 발견할 때까지는 훌륭하게 작동했습니다.

[    2.334153] md/raid:md0: not clean -- starting background reconstruction
[    2.334164] md/raid:md0: device sdc1 operational as raid disk 2
[    2.334165] md/raid:md0: device sdd1 operational as raid disk 1
[    2.334165] md/raid:md0: device sdb1 operational as raid disk 0
[    2.334333] md/raid:md0: raid level 5 active with 3 out of 3 devices, algorithm 2
[    2.334479] md0: bitmap file is out of date (39126 < 39127) -- forcing full recovery
[    2.334493] md0: bitmap file is out of date, doing full recovery
[    2.422418] md0: detected capacity change from 0 to 1610344300544
[    2.422606] md: resync of RAID array md0
...
[    9.537010] EXT4-fs (dm-0): mounted filesystem with ordered data mode. Opts: (null)

분명히 말하면 이는 비트맵 자체가 최신이 아니므로 전체(느린) 재동기화가 발생한다는 것입니다. 파일 시스템 자체가 깨끗해집니다. 나생각하다이것은 종료 시 타이밍 문제입니까? LVM이 마운트 해제되고 있지만 종료 전에 RAID가 중지되지 않습니까? 컴퓨터를 종료하면 이상한 동작이 보이지 않습니다. 시스템 로그에는 무언가 종료되고 있다고 표시되지만 그게 전부입니다.

전원을 끄지 않고 정지를 했다면 이런 일이 일어날 가능성은 크게 줄어들겠지만, 오늘 아침에도 그런 일이 일어나서 3개월간 아무 생각 없이 드디어 글을 썼습니다.

RAID 어레이 세부정보:

/dev/md0:
        Version : 1.2
  Creation Time : Fri Sep 11 17:49:27 2015
     Raid Level : raid5
     Array Size : 1572601856 (1499.75 GiB 1610.34 GB)
  Used Dev Size : 786300928 (749.88 GiB 805.17 GB)
   Raid Devices : 3
  Total Devices : 3
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Mon Apr  2 08:38:28 2018
          State : active, resyncing 
 Active Devices : 3
Working Devices : 3
 Failed Devices : 0
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 512K

  Resync Status : 52% complete

           Name : underlay:0  (local to host underlay)
           UUID : 520c8995:8d934562:0e2f5b8e:d460bfed
         Events : 40381

    Number   Major   Minor   RaidDevice State
       0       8       17        0      active sync   /dev/sdb1
       1       8       49        1      active sync   /dev/sdd1
       3       8       33        2      active sync   /dev/sdc1

나는 이것을 더 조사하는 방법조차 모릅니다. 시작 화면을 비활성화하도록 GRUB를 설정하여 화면에서 dmesg를 볼 수 있지만 흥미로운 내용은 볼 수 없습니다. 때때로 서비스가 종료되지 않고 systemd가 서비스를 종료하기 전에 90초를 기다리는 상황에 직면합니다. 나는 그것이 무엇인지 그리고 안전한 마운트 해제가 되지만 안전하지 않은 RAID(끄기? 비활성화? 마운트 해제?)를 발생시키는지 여부를 알 수 없습니다. 나는 커널이 여기서 무엇이 잘못되었는지 확인하기 위해 일반적으로 어떻게 RAID를 끄는지조차 잘 이해하지 못합니다.

둘째, 데스크탑 상호 작용을 완전히 파괴하지 않는 RAID 재동기화에 대한 조언을 주시면 감사하겠습니다. IO 조절이 /proc/sys/dev/raid/speed_limit_max실제로 내가 원하는 방식으로 작동하지 않습니다. 내 컴퓨터는 10초 동안 최대 속도로 동기화한 다음 3초 동안 대기하므로 동기화 속도가 느려집니다.그리고2시간 정도 사용해도 여전히 짜증스럽습니다.

답변1

fstab문제는 내 네트워크 설치가 때때로 종료 시 중단되는 것으로 밝혀졌습니다 . 네트워크 마운트가 RAID 파일 시스템 내의 마운트 지점에 없는 이유가 무엇인지 잘 모르겠습니다. 모두 /SSD에 마운트되어 있습니다.

18.04로 옮겨도 문제가 해결되지 않았고 netmount와 관련된 것으로 밝혀진 부팅 지연이 있었기 때문에 실제로 발견했습니다.

관련 정보