fio seq_writes가 dd보다 훨씬 빠른 이유는 무엇입니까?

Question

몇 가지 맥락을 강조하기 위해 귀하의 질문을 재구성하겠습니다.

왜?
fio --name=seqwrite --rw=write --bs=128k --numjobs=1 --size=16G --runtime=120 --iodepth=1 --group_reporting
보다 빠른
time dd if=/dev/random of=./test_file bs=128k count=131072 
768GB RAM, SAS HDD 및 ZFS가 압축이 활성화된 RAIDZ2로 구성된 FreeBSD 11.2 시스템에서?

가장 큰 차이점은 fio가 테스트를 시작하기 전에 파일을 미리 생성한다는 것입니다.

seqwrite: Laying out IO file (1 file / 16384MiB)

대신 dd파일 확장자 쓰기가 발생할 수 있습니다(이로 인해 메타데이터 업데이트가 발생함). 또한 RAM(768G)이 너무 많지만(16G) 이에 비해 쓰는 데이터가 거의 없으므로 쓰기가 RAM에 보관될 가능성이 높습니다(실제로 훨씬 나중에 디스크에 기록되지 않음). fio파일이 미리 만들어져 있고 각 I/O에 대해 수정해야 하는 파일 메타데이터가 거의 없는 경우 이런 일이 발생할 수 있습니다 . 적어도 기록된 모든 데이터가 커널에서 다시 기록될 때 작업이 끝날 때까지 완료되었다고 말하지 않도록 fio에게 지시할 수 있습니다.end_fsync=1.

(참고: 디스크가 수행할 수 있는 것으로 알고 있는 것보다 훨씬 낮은 완료 지연 시간을 보면 I/O가 버퍼링 중이라는 미묘한 힌트가 있습니다.

clat(usec): 최소=28, 최대=2585, 평균=48.03, stdev=24.04

회전 디스크가 실제로 28마이크로초 안에 I/O 작업을 완료할 수 있습니까? 그렇지 않다면 아마도 어딘가에 버퍼링되어 있을 것입니다)

마침내,fio는 기본적으로 후속 블록에서 동일한 패턴을 재사용합니다.. 압축이 수행되므로 fio처리량을 더욱 향상시킬 수 있습니다(그러나 이는 ZFS 레코드 크기와 같은 요인에 따라 달라집니다). 이를 확인하려면 fio에게 버퍼를 압축할 수 없게 만들고(결국 켜짐 refill_buffers) 처리량이 떨어지는지 확인하라고 지시합니다(귀하의 경우에는 그렇습니다).

너무 깁니다. 귀하가 제공 한 fio및 명령은 dd동일한 것을 테스트하지 않습니다. 파일이 이미 올바른 크기로 존재하는지 여부, 작성 중인 데이터가 얼마나 압축 가능한지, 데이터가 모두 다시 기록되었는지 확인하지 않고 너무 적은 데이터를 기록하여 커널 버퍼링을 고려하고 있는지 여부 등의 사항에 주의를 기울여야 합니다. 디스크.

Answer 1