소프트웨어 방법을 사용하여 하드웨어 오류를 확인하는 방법은 무엇입니까?

소프트웨어 방법을 사용하여 하드웨어 오류를 확인하는 방법은 무엇입니까?

소프트웨어 솔루션만 사용하여 불량 블록, 불량 메모리 등을 확인하는 방법은 무엇입니까? 우분투 11.04를 사용하고 있습니다.

답변1

badblocks드라이브의 각 LBA에 쓰기/읽기를 위해 특별히 설계된 유틸리티가 필요한지 확인 하고 그 과정에서 오류를 테스트하십시오. badblocks비파괴 및 파괴 테스트를 제공합니다(아래에 설명되어 있지만 최신 하드 드라이브에서는 그다지 유용하지 않습니다).

드라이브의 SMART 매개변수를 알고 싶다면 확인해 보세요 smartctl.

내가 아는 한, Linux에서 실행할 수 있는 포괄적인 메모리 테스트 소프트웨어는 없지만 RAM에 대한 포괄적인 테스트를 제공할 수 있는 존경받는 유틸리티인 memtest86+로 부팅할 수 있습니다.

Linux 커널을 컴파일하면 CPU와 RAM 모두에 많은 부담이 가해집니다. 컴파일 중에 오류가 임의의 위치에서 발생하는 경우(재현 가능한 오류가 아닌) RAM 또는 CPU 문제를 나타낼 수 있습니다.

stressCPU를 테스트하려는 경우 시스템에 스레드가 넘쳐 CPU 사용량이 높게 유지될 수 있는 유틸리티도 있습니다 .

lm-sensors올바르게 구성되면 온도, 팬 속도 및 온보드 전압 센서와 같은 정보를 볼 수 있습니다.

답변2

dmesg메모리/CPU 스트레스 테스트를 실행할 때 이 유틸리티의 출력을 관찰해야 합니다. 메모리 오류가 있으면 커널에서 불쾌한 오류 메시지가 표시됩니다. 특히 하드웨어에 ECC 기능이 장착되어 있는 경우 더욱 그렇습니다.

관련 정보