Debian을 실행하는 Dell Inspiron은 과도한 사용으로 인해 종료됩니다.

Debian을 실행하는 Dell Inspiron은 과도한 사용으로 인해 종료됩니다.

이것이 데비안 문제인지 하드웨어 문제인지는 모르겠지만 정보는 Linux에 있습니다.

Dell Inspiron 520(AMD 칩)에 Debian 6.7을 설치했습니다. 나는 다음을 통해 CPU 정보를 얻습니다.

less /proc/cpuinfo

이로 인해

processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 6
model name      : AMD Athlon(tm) II X2 250 Processor
stepping        : 3
microcode       : 0x10000b6
cpu MHz         : 800.000
cache size      : 1024 KB
physical id     : 0
siblings        : 2
core id         : 0
cpu cores       : 2
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips        : 6000.65
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

processor       : 1
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 6
model name      : AMD Athlon(tm) II X2 250 Processor
stepping        : 3
microcode       : 0x10000b6
cpu MHz         : 800.000
cache size      : 1024 KB
physical id     : 0
siblings        : 2
core id         : 1
cpu cores       : 2
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips        : 6000.02
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

온도를 모니터링하기 위해 psensor를 설치했습니다. CPU 온도를 50C 미만으로 유지하면서 100% 사용량에 도달할 수 있습니다. 그러나 장기간 실행되고 CPU 집약적인 애플리케이션의 경우에는 다음과 같습니다.

sudo maldet --scan-all /

응용 프로그램이 완료되기 전에 컴퓨터가 종료됩니다. 어느 순간, 전원 표시등이 계속 켜져 있는 동안 데스크탑에서 높은 음의 윙윙거리는 소리가 들렸습니다. CPU 써멀 구리스를 Arctic Silver로 교체했습니다. 정상 작동 시 CPU 사용량이 100%이더라도 온도는 46도 정도까지 올라갑니다. 컴퓨터 측면을 제거해도 CPU 온도가 크게 변하지 않습니다.

나는 달렸다

sudo dmidecode |grep -B 2 Stat

그리고 얻었습니다

Serial Number: DST5MS1
Asset Tag: 
Boot-up State: Safe
Power Supply State: Safe
Thermal State: Safe
Security Status: None
--
Max Speed: 3000 MHz
Current Speed: 3000 MHz
Status: Populated, Enabled
--
Handle 0x0017, DMI type 32, 20 bytes
System Boot Information
Status: No errors detected

내가 들어갈 때

sensors

나는 가지고있다

k10temp-pci-00c3
Adapter: PCI adapter
temp1: +16.5°C (high = +70.0°C)

it8720-isa-0a10
Adapter: ISA adapter
in0: +1.07 V (min = +0.00 V, max = +4.08 V)
in1: +1.10 V (min = +0.00 V, max = +4.08 V)
in2: +3.02 V (min = +0.00 V, max = +4.08 V)
+5V: +3.01 V (min = +0.00 V, max = +4.08 V)
in4: +3.33 V (min = +0.00 V, max = +4.08 V)
in5: +2.14 V (min = +0.00 V, max = +4.08 V)
in6: +2.14 V (min = +0.00 V, max = +4.08 V)
5VSB: +2.96 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.25 V 
fan1: 816 RPM (min = 0 RPM)
fan2: 888 RPM (min = 0 RPM)
temp1: +23.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp2: +33.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp3: -128.0°C (low = -1.0°C, high = +127.0°C) sensor = disabled
cpu0_vid: +0.375 V
intrusion0: ALARM

전원을 바꿨어요이것

나는 그것을 실행하여 스트레스 테스트하기로 결정했습니다

sudo maldet --scan-all /

터미널 창에서. 이 호출은 몇 시간 동안 실행될 수 있으며 많은 CPU 리소스를 소모합니다. psensor의 팬 1이 갑자기 830에서 770으로 떨어졌다가 천천히 상승하기 시작했습니다. 하지만 CPU 온도는 섭씨 30도 이상에서 40도 이상으로 점차 높아졌다. 밤에 잠자리에 들었을 때 Maldette는 1/4 정도 완성되었고 온도는 40도 중반이었습니다. 다음날 아침 컴퓨터가 작동을 멈췄습니다. 단순히 커서만 그런 것이 아닙니다. 컴퓨터에서 웹사이트를 실행하고 있는데 접속이 안 되거든요.

Gnome 데스크탑 문제를 해결하기 위해 Debian을 다시 시작하고 ctrl-alt-F4를 눌러 기본 명령줄을 입력했습니다. 그럼 난 달렸어

sudo maldet --scan-all /

몇 시간 동안 실행되었고 컴퓨터는 꽤 높은 소리를 내기 시작했고, 큰 소리로 불평했으며, 화면에 계속 바뀌는 임의의 텍스트가 많이 있었습니다. 그것이 어디서 왔는지 말하기는 어렵습니다. 하드를 뽑은 후 문자는 멈췄지만 칭얼거리는 소리는 들리지 않아 전원 문제가 아닐까 의심해봤습니다.

다시 실행하기 시작했는데, 이번에는 PSU인지 확인하기 위해 PC 외부의 PSU를 사용했습니다. 약 한시간쯤 지나서 화면에 아래와 같은 문구가 떴습니다. (스크롤을 해서 보이지 않게 된 이후로 처음 몇 줄을 놓쳤을 수도 있습니다.)

test_tsk_need_resched
check_preempt_cur
ttwu_do_wakeup
x86_pmu_config_addr
paravirt_write_msr
perf_ctx_adjust_freq
read_tsc
timekeeping_get_ns
ktime_get_update_offsets
hrtimer_interrupt
test_tsk_need_resched
resched_tsk
check_preempt_curr
ttwin_do_wakeups
smp+apic_timer
apic_timer_interrupt
copy_pte_range
copy_page_range
dup_mn
copy_process
do_fork
stub_clone
system_call_fastpath

이 시점에서 PC는 키보드 Enter에 응답하지 않습니다.

편집하다:

메모리 테스트를 해보니

sudo /usr/bin/memtester 5 1

그리고 얻었습니다

memtester version 4.2.2 (64-bit)
Copyright (C) 2010 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 5MB (5242880 bytes)
got  5MB (5242880 bytes), trying mlock ...locked.
Loop 1/1:
  Stuck Address       : ok         
  Random Value        : ok
  Compare XOR         : ok
  Compare SUB         : ok
  Compare MUL         : ok
  Compare DIV         : ok
  Compare OR          : ok
  Compare AND         : ok
  Sequential Increment: ok
  Solid Bits          : ok         
  Block Sequential    : ok         
  Checkerboard        : ok         
  Bit Spread          : ok         
  Bit Flip            : ok         
  Walking Ones        : ok         
  Walking Zeroes      : ok         
  8-bit Writes        : ok
  16-bit Writes       : ok

Done.

답변1

CPU 쿨러가 잘 조여져 있는지 확인하고(합성 또는 부족 여부 확인) 팬을 확인하고, 메모리가 이 컴퓨터의 원인임을 발견했으며, 새 전원 공급 장치로 테스트하는 것도 나쁘지 않을 것입니다. 모든 표시기는 가능한 하드웨어 문제를 나타냅니다.

답변2

이것이 어떻게 소프트웨어 문제일 수 있는지 이해할 수 없습니다. 그 소음을 추적해야 합니다. PSU가 새 제품이고 이 문제로 인해 교체품으로 사용된 경우에도 이것이 원인이 아닐 가능성이 높습니다.

별로 관련이 없지만 디스크가 아닌 CPU에만 스트레스를 주는 작업을 시도해 보셨나요? 당신은 그것을 사용할 수 있습니다 :

pyrit benchmark_long

시스템이 충돌하기 전에 커널 로그를 확인하십시오. 아마도 유용한 것이 있을 것입니다.

소프트웨어와 관련이 없는지 확실히 확인하려면 Linux 부팅 CD를 구해 스트레스 테스트를 실행해 보세요. 충돌이 발생하면 하드웨어 문제일 가능성이 높습니다. 아니면 다른 운영 체제를 사용해 보는 것이 더 좋습니다.

스트레스 테스트 중에 온도를 계속 관찰하고 dmesg 또는 커널 로그의 오류 메시지를 주의 깊게 살펴보세요.

편집하다

메모리 오류로 인해 비슷한 문제가 발생할 수 있습니다. memtest86을 사용해 보세요. 과거에는 저에게 효과적이었습니다. 운영 체제에 관계없이 부팅 가능한 CD입니다. 다 잡을 것 같습니다.

http://www.memtest86.com/

관련 정보