lvmcache 및 ext4 data=journal => 과잉인가요?

lvmcache 및 ext4 data=journal => 과잉인가요?

우리는 lvmcache(24TB raid5 하드 드라이브 데이터, 64GB raid1 ssd 캐시 + 메타)를 실행 중이며 해당 raid5의 ext4 fs에 대해 data=journal이 있는 외부 저널을 사용하고 동일한 SSD raid1(32GB) 상위에 로그를 저장합니다.

성능과 데이터 무결성이 모두 필요합니다.

내가 이해한 바로는 ext4 메타데이터/로그 및 데이터가 먼저 로그에 기록되고(data=log), 데이터는 raid1에 로그를 유지하면서 raid5의 데이터 파일 시스템으로 이동됩니다. 데이터가 raid5로 이동되면 lvmcache에 의해 동일한 SSD raid1로 다시 캐시된 다음 결국 raid5로 이동됩니다.

이건 좀 과한거 아닌가요? 나에게는 데이터가 raid1의 lvmcache에 의해 버퍼링되므로 data=ordered를 사용하는 것만으로도 충분해 보입니다. 내가 맞나요?

성능과 무결성을 위해 lvmcache와 외부 ext4 로그(SSD raid1 사용)를 어떻게 설정하거나 결합합니까?

감사해요!

답변1

저는 lvmcache에 대해 잘 알지 못하지만 플래시에 데이터를 두 번 쓰는 것은 확실히 성능에 도움이 되지 않습니다. 이렇게 하면 플래시 메모리에 대한 쓰기 오버헤드가 두 배로 늘어납니다. 외부 저널을 사용하면 data=journal을 사용하여 빠른 동기 쓰기 성능을 얻을 수 있으며 이는 이미 HDD/RAID 대기 시간을 숨깁니다.

읽기 데이터만 캐시하도록 lvmcache를 구성할 수 있으면 데이터 로그가 보완됩니다.

관련 정보