sysstat 온도 로깅 활성화

sysstat 온도 로깅 활성화

과거 온도 정보를 사용하여 향후 호스트 오류를 ​​진단할 수 있도록 sysstat에서 온도를 판독하도록 설정하려고 합니다.

온도 정보를 얻기 위해 다음 명령을 사용하려고 합니다.

$ sar -m TEMP
Requested activities not available in file /var/log/sysstat/sa22

이에 대한 sar 매뉴얼 페이지의 내용은 다음과 같습니다.

-m { keyword [,...] | ALL }
       Report power management statistics.  Note that these statistics depend on sadc's option "-S  POWER"  to
       be collected.

       Possible keywords are CPU, FAN, FREQ, IN, TEMP and USB.

       [...]

       With  the  TEMP  keyword,  statistics about devices temperature are reported.  The following values are
       displayed:

따라서 전원 관리 정보는 기본적으로 기록되지 않습니다(온도는 이 정보의 하위 집합임). 그래서 파일을 /etc/sysstat/sysstat활성화하도록 변경했습니다. 나는 이것을 변경했습니다 :

# Parameters for the system activity data collector (see sadc(8) manual page)
# which are used for the generation of log files.
# By default contains the `-S DISK' option responsible for generating disk
# statisitcs. Use `-S XALL' to collect all available statistics.
SADC_OPTIONS="-S DISK"

다음을 입력하세요:

SADC_OPTIONS="-S DISK,POWER"

또 다른 질문은sysstat 문제 추적기sysstat를 실행하려면 lm-sensor가 필요하다고 해서 해당 패키지도 설치했습니다. 출력은 다음과 같습니다 sensors.

$ sensors
acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C  (crit = +119.0°C)
temp2:        +29.8°C  (crit = +119.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +89.0°C  (high = +82.0°C, crit = +100.0°C)
Core 0:        +86.0°C  (high = +82.0°C, crit = +100.0°C)
Core 1:        +88.0°C  (high = +82.0°C, crit = +100.0°C)
Core 2:        +89.0°C  (high = +82.0°C, crit = +100.0°C)
Core 3:        +89.0°C  (high = +82.0°C, crit = +100.0°C)
Core 4:        +88.0°C  (high = +82.0°C, crit = +100.0°C)
Core 5:        +87.0°C  (high = +82.0°C, crit = +100.0°C)

nvme-pci-0800
Adapter: PCI adapter
Composite:    +38.9°C  (low  = -273.1°C, high = +84.8°C)
                       (crit = +84.8°C)
Sensor 1:     +38.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +37.9°C  (low  = -273.1°C, high = +65261.8°C)

그래서 이것은 내 온도 센서를 올바르게 감지하는 것 같습니다.

또 다른 컬렉션을 위해 10분 정도 기다려 보았습니다. (내 시스템은 10분마다 05, 15, 25 등의 시간에 로그를 기록하도록 구성되어 있습니다.)

불행하게도 이 모든 작업을 수행한 후에도 여전히 동일한 오류가 발생합니다.

$ sar -m TEMP
Requested activities not available in file /var/log/sysstat/sa22

답변1

저는 다음 세 단계를 거쳐 이 작업을 성공적으로 수행했습니다.

  1. 위 질문에 대한 모든 설정을 완료하세요.

  2. 현재 날짜의 sysstat 로그 파일을 삭제합니다.

    root@host:~# sar -m TEMP
    Requested activities not available in file /var/log/sysstat/sa30
    root@host:~# rm /var/log/sysstat/sa30
    
  3. 스크립트 실행 /usr/lib/sysstat/debian-sa1 1 1(Debian/Ubuntu가 아닌 시스템에서는 다를 수 있음)

그 후에는 sar -m TEMP그냥 실행하세요.

관련 정보