![로직 직접 액세스 오류 재설정 ||](https://linux55.com/image/226388/%EB%A1%9C%EC%A7%81%20%EC%A7%81%EC%A0%91%20%EC%95%A1%EC%84%B8%EC%8A%A4%20%EC%98%A4%EB%A5%98%20%EC%9E%AC%EC%84%A4%EC%A0%95%20%7C%7C.png)
이 기간 동안 Linux 서버에 영향을 미치는 LVM 재설정 장치에 버그가 있었습니다.
kernel: hpsa 0000:02:00.0: scsi 0:1:0:1: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1
kernel: hpsa 0000:02:00.0: device is ready.
현재 SCSI 디스크보다 낮습니다.
[0:0:0:0] storage HP P420i 6.68 -
[0:1:0:0] disk HP LOGICAL VOLUME 6.68 /dev/sda
[0:1:0:1] disk HP LOGICAL VOLUME 6.68 /dev/sdb
[1:0:0:0] tape HP Ultrium 4-SCSI U57D /dev/st0
[2:0:0:0] cd/dvd hp DVD A DU8D4SH MHE4 /dev/sr0
또한 디스크를 확인한 결과 하드웨어 오류도 발견되지 않았습니다.
Smart Array P420i in Slot 0 (Embedded)
Note: Predictive Spare Activation Mode is enabled, physical drives that are in predictive failure state will not be available for use as data or spare drives.
(sn: 00143803620FFA0)
Port Name: 1I
Port Name: 2I
Internal Drive Cage at Port 1I, Box 1, OK
Internal Drive Cage at Port 2I, Box 1, OK array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (279.4 GB, RAID 1, OK)
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)
physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 300 GB, OK, spare)
array B (SAS, Unused Space: 0 MB)
logicaldrive 2 (558.7 GB, RAID 1+0, OK)
physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 300 GB, OK)
physicaldrive 2I:1:5 (port 2I:box 1:bay 5, SAS, 300 GB, OK)
physicaldrive 2I:1:6 (port 2I:box 1:bay 6, SAS, 300 GB, OK)
physicaldrive 2I:1:7 (port 2I:box 1:bay 7, SAS, 300 GB, OK)
physicaldrive 2I:1:8 (port 2I:box 1:bay 8, SAS, 300 GB, OK, spare)
SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380 (WWID: 500143803620FFAF)
이 오류는 서버 중 하나에서만 발견되었으며 다른 서버에서는 동일한 문제가 발생하지 않았습니다.
모든 테마에서 하드웨어 오류가 발생하고 HP 하드웨어 오류를 발견하지 못했기 때문에 문제에 대한 수정 사항을 검색할 방법을 찾으려고 노력 중입니다.
답변1
이는 LVM과 관련이 없습니다. 이는 하드웨어 RAID 컨트롤러에서 생성된 논리 디스크와 관련됩니다. 불행하게도 HP는 LVM 용어와 비슷하게 들리는 이름을 선택했습니다.
두 번째 로그 메시지("장치가 준비되었습니다")는 오류 상태가 자동으로 지워졌음을 나타냅니다.
하드웨어 RAID 컨트롤러는 HP(E) Smart Array P420i입니다. 펌웨어 버전은 6.68인 것으로 보이며, 이후 펌웨어 버전에서 수정된 몇 가지 알려진 문제가 있습니다.
2017년 11월 최신 펌웨어 버전은 8.32입니다.여기서 다운로드 가능. 최신 버전의 주요 수정 사항은 다음과 같습니다.
RAID 스택 스레드가 기본 코드 펌웨어에서 반환한 완료를 위해 대기열을 폴링하기 때문에 코드를 잠그지 않고 라이브 잠금 상태로 인해 시스템이 응답을 중지할 수 있습니다.
이것이 당신이 보고 있는 문제인 것 같습니다. 따라서 RAID 컨트롤러 펌웨어를 사용 가능한 최신 버전으로 업데이트하면 근본 원인을 해결할 수 있습니다.설치 지침을 읽어보세요업데이트를 시작하기 전에.
디스크 컨트롤러가 응답을 중지하면 컨트롤러 유형에 관계없이 Linux 커널이 자동으로 먼저 재설정을 시도합니다. 귀하의 경우에는 RAID 컨트롤러의 차단을 성공적으로 해제하고 시스템 충돌을 방지한 것으로 보입니다. 즉, 이는 유효한 해결 방법이지만 이에 의존하는 것은 분명히 이상적이지 않습니다. 특히 이런 일이 반복적으로 발생하는 경우에는 더욱 그렇습니다.
HPE에서는 P420i가 단종된 제품이라고 명시하고 있습니다. 즉, 더 이상 새 제품으로 제조 및 판매되지 않습니다. 현재 펌웨어 버전은 2015년 10월에 출시되었으므로 RAID 컨트롤러는 이제 약 8년이 된 것으로 보입니다. 대기업에서는 해당 시대의 중요한 x86 서버를 노후화라는 이유만으로 폐기하는 것을 진지하게 고려할 것입니다. 이러한 오래된 서버에 대한 공급업체 지원은 엄청나게 비싸고/또는 예비 부품을 시기적절하게 제공하는 것이 어려워지기 때문에 현재 하드웨어만큼 효과적이지 않기 때문입니다.
예비 부품을 조달할 수 있는 유사한 서버가 많이 있는 경우 오류를 직접 처리할 수도 있습니다. 그렇지 않으면 좋은 백업과 실행 가능한 계획이 있기를 바랍니다.언제(아니요만약에) 서버의 일부 구성 요소는 결국 실패하게 됩니다.