내 PC의 SSD 마모 및 손상에서 btrfs의 역할을 어떻게 측정할 수 있습니까?

내 PC의 SSD 마모 및 손상에서 btrfs의 역할을 어떻게 측정할 수 있습니까?

저는 Samsung EVO SSD에서 암호화된 파티션(luks)으로 btrfs를 사용하고 있습니다. 디스크가 예상보다 빠르게 실패하고 있습니다. 이러한 디스크에서 ext4를 더 안정적으로 사용할 수 있는지, 아니면 어떤 용도로 사용하면 ext4가 더 많이 마모될 수 있는지 어떻게 평가합니까?

배경

데스크탑 컴퓨터에서 루트 및 기본 디스크로 약 2년 동안 사용한 후, Samsung SSD 870 EVO 500GB는 수백 개의 불량 블록과 수천 개의 수정 불가능한 오류로 인해 실패하기 시작했습니다.

$ sudo smartctl -a /dev/sda
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.2.15-100.fc36.x86_64] (local build)

=== START OF INFORMATION SECTION ===
Device Model:     Samsung SSD 870 EVO 500GB
Firmware Version: SVT01B6Q

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Self-test execution status:      ( 121) The previous self-test completed having
                                        the read element of the test failed.

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       19378
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       69
177 Wear_Leveling_Count     0x0013   098   098   000    Pre-fail  Always       -       44
183 Runtime_Bad_Block       0x0013   065   065   010    Pre-fail  Always       -       200
187 Uncorrectable_Error_Cnt 0x0032   099   099   000    Old_age   Always       -       2696
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       59
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       83504703737

디스크 사용량이 꽤 많지만 그보다 훨씬 적습니다.보증 제한5년 또는 300TB TBW.

전작인 삼성 850 EVO 250GB는 5년 사용 후에도 비슷한 상태다. 어쩌면 새 디스크가 이전 디스크보다 더 나쁠 수도 있지만 공통점이 있는지 궁금해지기 시작했습니다.

그들이 공유한 것 중 하나는 내가 Fedora를 설치했고 최근 Fedora는 ext4(대부분의 경우 이전 디스크는 ext4였다고 생각합니다) 대신 기본적으로(적어도 luks 파일 시스템의 경우) btrfs를 사용하기 시작했다는 것입니다. 예를 들어 Fedora 38은 기본적으로 다음 레이아웃을 생성합니다.

$ lsblk
NAME                MAJ:MIN RM   SIZE RO TYPE  MOUNTPOINTS
sda                   8:0    0 465,8G  0 disk  
├─sda1                8:1    0   600M  0 part  /boot/efi
├─sda2                8:2    0     1G  0 part  /boot
└─sda3                8:3    0 464,2G  0 part  
  └─luks-<redacted> 253:0    0 464,2G  0 crypt /home
                     /
$ mount | grep luks
/dev/mapper/luks-<redacted> on / type btrfs (rw,relatime,seclabel,compress=zstd:1,ssd,discard=async,space_cache=v2,subvolid=257,subvol=/root)
/dev/mapper/luks-<redacted> on /home type btrfs (rw,relatime,seclabel,compress=zstd:1,ssd,discard=async,space_cache=v2,subvolid=256,subvol=/home)
$ mount | grep sda
/dev/sda2 on /boot type ext4 (rw,relatime,seclabel)
/dev/sda1 on /boot/efi type vfat (rw,relatime,fmask=0077,dmask=0077,codepage=437,iocharset=ascii,shortname=winnt,errors=remount-ro)

몇년전에도 상황은 비슷했지만압축그리고 다른 btrfs 매개변수.

COW(기록 중 복사)에 대해 논의한 후 btrfs 문서에는 할 말이 많습니다.SSD 경고:

"너무 많은" 다양한 데이터(예: 암호화)를 기록하면 내부 중복 제거가 무효화되고 광범위한 재작성이 발생하여 저장 장치의 마모가 증가할 수 있습니다. SSD의 작동 방식에 대한 정보가 부족하거나 장치에서 제공하는 신뢰할 수 있는 통계로 인해 SSD의 기대 수명을 안정적으로 결정할 수 없습니다. SSD의 실제 수명 쓰기 볼륨의 50%~100%를 소비하는 사용자만 btrfs DUP 메타데이터의 쓰기 증폭에 관심을 가져야 합니다.

따라서 쓰기 볼륨이 보증에서 약속한 것보다 훨씬 적음에도 불구하고 디스크 실제 수명의 50% 이상에 도달한 것 같습니다.~해야 한다btrfs SSD 마모가 걱정됩니다.

사용 패턴

이제 나는 당신이BTRFS 스크럽월간 및 정전과 같은 사건 발생 후:

사용자는 수동으로 실행하거나 예약된 시스템 서비스를 통해 실행해야 합니다. 권장 기간은 1개월이지만, 더 짧을 수도 있습니다.

나는 이것을 한 적이 없습니다. 그럼에도 불구하고 가장 자주 액세스되는 파일은 어느 시점에서 확인되고 복구됩니다. 손상된 파일은 오래되고 액세스가 적은 편에 있는 경향이 있습니다.

(이것이 중요하다면 이상합니다. SMART에 따르면 luks+lvm+ext4를 사용하는 다른 SSD는 아무런 문제 없이 10,000번 이상의 전원 주기를 가집니다.)

가능한 아이디어

사람들은 일반적으로 btrfs에서 데이터베이스나 기타 유사한 쓰기 집약적 작업 부하를 실행하지 말 것을 권장합니다.

위의 제안 사항이 사실인지 최신인지는 알 수 없지만 내 컴퓨터에서 실행 중인 데이터베이스가 없습니다. 반면에 이전 디스크의 가장 파괴적인 오류는 Thunderbird가 메시지 저장을 위해 사용하는 영역(수 기가바이트의 mbox 파일이 포함되어 있으며 이후 Maildir로 전환했습니다)에서 발생했습니다. 내 컴퓨터에 데이터베이스와 같은 로드 없이도 수행할 수 있거나 다른 파일 시스템으로 이동할 수 있는지 궁금합니다. (나는 baloo를 비활성화했습니다.)

어떤 응용 프로그램이 파일 시스템에서 가장 많은 쓰기(또는 마모 가능성이 가장 높음)를 생성하는지 알 수 있는 벤치마킹 도구나 유틸리티가 있습니까?

또는 특정 파일 시스템-디스크 조합을 스트레스 테스트하고 디스크의 자체 보고된 마모에 대한 다양한 시나리오의 영향을 확인할 수 있는 벤치마킹 도구 또는 유틸리티가 있습니까?

답변1

2021년 초중반 Samsung 870 EVO SSD일찍 실패하는 경우가 많다 바로잡을 수 없는 실수 때문이다.

드라이브를 반납하시는 것이 좋습니다. 삼성에 전화해서 받으셔야 해요반품 승인SSD의 경우 이메일을 보내지 마세요.

관련 정보