새로운 Linux 시스템 충돌 문제 해결

새로운 Linux 시스템 충돌 문제 해결

방금 새 컴퓨터를 만들고 centos7(RHEL 기반)을 설치했으며 mint 17.3(Ubuntu 기반)도 사용해 보았습니다. 문제없이 설치되었습니다. OS는 원활하게 실행되며 모든 것이 몇 시간 동안 빠르다가 잠깁니다. Firefox, Chrome, Timeshift, VMware Workstation, 디스크 유틸리티 등의 여러 인스턴스를 열고 지속적으로 3D 데스크톱을 전환하면 문제가 반복될 수 있으며 결국 작동이 중지됩니다. 다른 컴퓨터에서는 SSH로 접속할 수도 없습니다. 문제를 재현하려고 하지 않으면 탭 2~3개로 Firefox를 실행할 수 있지만 몇 시간 사용하고 나면 작동이 멈춥니다.

이 컴퓨터를 사용하는 동안 나는 항상 터미널에서 top 명령을 실행합니다. 최근 동결에서 상위 4개 애플리케이션의 CPU 비율은 각각 52%, 37%, 21%, 10%였으며 RAM 사용량은 2.0%, 0.8%, 0.8%, 0.4%였습니다. 상위 애플리케이션은 충돌이 발생할 때마다 다르지만 사용법은 거의 동일합니다. 주변 온도가 21~23°C인 방에서 CPU 온도는 42~47°C였습니다(AMD에서는 온도가 좋다고 합니다). 극단적인 것은 없습니다.

정지되면 시스템은 Ctrl+Alt+F1, Ctrl+Alt+Backspace 또는 Ctrl+Alt+Del에 응답하지 않습니다. 또한 네트워크의 다른 컴퓨터에서 SSH를 통해 액세스할 수 없습니다. 정지되면 네트워크에 표시되지도 않습니다. 다시 부팅하기 위해 재부팅하는 데 어려움을 겪었습니다.

내가 시도한 것:
다른 버전의 Linux
재설치 마더보드 재설정(현재 BIOS 버전)
memtest86을 사용하여 RAM 테스트
전원 공급 장치 테스트 및 교체
독점 nvidia 드라이버 다운로드 및 설치
보기이것생각을 표현하다

이 시점에서 나는 mint 17.3에서 모든 문제 해결을 수행하고 다음을 사용하여 출력을 보고 있습니다.

top  

그리고

tail -f /var/log/{messages,kernel,dmesg,syslog}

문제를 해결/추적하기 위해 커널 수준에서 수행할 수 있는 다른 작업이 있습니까?

하드웨어:
ASUS M5 A97 R2.0 마더보드
AMD FX 8320 8코어 3.5GHz CPU
Nvidia Geforce GT 730
2x8GB Kingston Hyperx 1866 DDR3 RAM
250GB Samsung SSD 850 EVO
1000Watt 80+Gold 전원 공급 장치(필수는 아니지만 확장 기능이 있습니다... 현재 시스템 전력량 ~280w 및 EVGA 지원에 따르면 저전력 시스템에서 높은 전력량 PS를 사용하는 것은 비효율적이지만 문제는 아닙니다.

답변1

top에 따르면 마지막 변경 후 2일 1시간 46분이 지났습니다(변경하고 재부팅하고 top 명령을 시작했습니다). virtualbox(Linux 게스트 설치 및 실행)부터 vmware station(windows 및 Linux mint 게스트 실행 및 더 많은 Linux 게스트 설치), 타임시프트, 다중 브라우저(chrome, 많은 탭 firefox 포함), 3d 큐브 데스크탑 전환, 스팀 등 시스템이 아직 얼지 않았습니다. 제가 수행한 일부 멀티태스킹에서는 CPU 성능이 200%를 넘었습니다(코어가 8개이므로 800%를 나타냅니다).

마지막 변경 사항은 그래픽 카드용 ubuntu nvidia 드라이버를 제거하고 지침에 따라 nvidia 사이트에서 직접 독점 드라이버를 설치하는 것이었습니다. 나는 원본 기사를 게시하기 전에 최후의 노력으로 이 작업을 수행했으며, 오픈 소스 드라이버가 이 카드와 유사한 카드에 완벽하다는 내용을 읽은 스레드 수를 고려할 때 이것이 작동할 것이라고는 기대하지 않았습니다.

이번에는 그래픽 카드 드라이버 문제인 것 같습니다.

답변2

저는 Bruce의 의견에 동의합니다. 첫째, 가장 쉬운 방법은 NVidia 드라이버를 다시 설치하는 것입니다. Mint를 실행한다고 가정하면

sudo apt-get remove --purge nvidia*

그 다음에whereis nvidia

파일이 계속 나타나면 삭제하세요.

그런 다음 NVIDIA 드라이버를 다시 설치하십시오.

메모리 문제를 확인하세요.

스틱 중 하나만 빼고 모두 제거하고 재부팅한 후 컴퓨터를 실행하세요. 각 스틱을 한 번에 하나씩 교체하고 검사하십시오. 스틱이 나쁘면 쉽게 알 수 있습니다(그러나 빨리는 아님).

문제가 지속되면 다양한 조치를 취할 수 있지만, 불행하게도 이제 케이블을 교체하고 다른 전원 공급 장치를 사용해 보는 등 비용을 지출해야 합니다.

관련 정보