몇 분마다 몇 초 동안 바나나 파이를 정지시키는 프로세스를 어떻게 확인할 수 있습니까?

몇 분마다 몇 초 동안 바나나 파이를 정지시키는 프로세스를 어떻게 확인할 수 있습니까?

답변

autoneg를 Turn()하여 "정지" 문제를 해결했습니다 ethtool -s eth0 duplex full autoneg off.

내가 이걸 어떻게 찾았지?

각 정지 후 아래 게시물의 도움으로 디스크 I/O를 모니터링하면 rsynclogd가 정지 후 디스크에 쓰고 있는 것을 볼 수 있습니다. 그런 다음 /var/log에서 마지막 변경 사항을 확인하고 kern.log에 정지 후 링크/링크 다운 메시지가 있음을 발견했습니다. 그래서 아마도 네트워크 카드가 꺼졌다 켜지고 SSH를 통해 연결하거나 웹 서버에 액세스하려고 하면 정지되는 것처럼 보일 것이라고 생각했습니다.

원래 질문

나는 Xubuntu를 사용하여 바나나 껍질을 가지고 있습니다.

DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=14.04
DISTRIB_CODENAME=trusty
DISTRIB_DESCRIPTION="Ubuntu 14.04.3 LTS"
NAME="Ubuntu"
VERSION="14.04.3 LTS, Trusty Tahr"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 14.04.3 LTS"
VERSION_ID="14.04"
HOME_URL="http://www.ubuntu.com/"
SUPPORT_URL="http://help.ubuntu.com/"
BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"
No LSB modules are available.
Linux version 3.4.103 (bananapi@lemaker) (gcc version 4.6.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) ) #4 SMP PREEMPT Thu Dec 18 12:55:58 CST 2014
armv7l

몇 분마다 전체 시스템이 몇 초 동안 정지됩니다. 실행을 시도했지만 topCPU % 측면에서 특이한 점은 표시되지 않습니다.

SSH를 통해 로그인했기 때문에 작동이 멈춘다는 것을 알았고, 입력하려고 하면 텍스트가 나타나는 데 5~30초 정도 걸리며 컴퓨터에서 무엇이든 할 수 있습니다.

어떤 프로세스가 이 작업을 수행하는지 어떻게 알 수 있나요? 나는 그것이 몇 분마다 일어난다고 말했지만, 내가 알 수 있는 것은 그것은 꽤 무작위적인 것입니다. 때로는 한동안 눈치채지 못하다가 다시 계속해서 입력하지 않게 됩니다.

top내가 말한 대로 실행해 보았습니다. 몇 초마다 목록을 업데이트하는 것처럼 보였지만 더 오래 일시 중지된 다음 "따라잡아" 1초에 20x를 새로 고치고 평소대로 계속했습니다.

나는 또한 거기에서 Apache 웹 서버를 실행하고 있습니다. 때때로 페이지를 로드하는 데 오랜 시간이 걸리며 다음으로 페이지가 다시 다운된다는 것을 알고 있습니다. 5~30초 정도 소요되며, 잠시 후 다시 정상적으로 작동됩니다.

[편집하다]

아래 답변에 게시된 명령을 실행했습니다. 4096B 쓰기, 3.5% CPU를 갖춘 apache2만 계속 표시되지만 정지는 없습니다. 그런 다음 갑자기 약 10초 동안 멈추고 종료되는 유일한 것은 rsyslogd: 0 0 |iotop 4507 40k 511B5.0%|jbd2/sda1-8 55 0 32k 0% 0 0 |iotop 4507 36k 570B 11%|| 0 0 |iotop 4507 40k 719B 11%||11%| 0 0 |iotop 4507 39k 582B 11%||rsyslogd 285 0 8192B0.5% 0 0 |iotop 4507 31k 0 12%|11%| 0 0 |iotop 4507 8653B 600B1.0%|11%| 0 0 |iotop 4507 36k 479B 11%||11%| 0 0 |iotop 4507 42k 534B 11%||11%| 0 0 |iotop 4507 37k 404B 11%||jbd2/sda1-8 55 0 8192B 0% 0 0 |iotop 4507 40k 745B 11%||11%| 0 0 |sshd: bananapi@pts/4 4549 206B 280B 0%|11%| 0 0 |iotop 4507 37k 639B7.5%|11%| 0 0 |iotop 4507 40k 533B 11%||11%| 0 0 |iotop 4507 37k 385B 11%||11%| 0 0 |iotop 4507 41k 511B 11%||11%| 0 0 |iotop 4507 7520B 0 10%|11%| 0 0 |iotop 4507 29k 555B2.5%|11%| 0 0 |iotop 4507 40k 704B 11%||rsyslogd 285 0 8192B 0% ...하지만 이 프로세스에는 CPU 사용량이나 디스크 IO가 많지 않습니다.

고쳐 쓰다: 다시 말하지만, 동결 후 유일한 차이점은 I/O 로그에 rsynclogd가 표시된다는 것입니다.

이게 정말 출처인가요? 8192바이트만 쓰고 CPU 사용량은 0%입니다.

[편집 3] grep rsyslogd */var/log에서 작업을 수행했는데 다음 메시지가 표시되었습니다. syslog:Oct 18 04:28:10 lemaker rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="285" x-info="http://www.rsyslog.com"] rsyslogd was HUPed syslog.1:Oct 18 04:00:01 lemaker rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="267" x-info="http://www.rsyslog.com"] exiting on signal 15. syslog.1:Oct 18 04:00:43 lemaker rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="285" x-info="http://www.rsyslog.com"] start syslog.1:Oct 18 04:00:43 lemaker rsyslogd: rsyslogd's groupid changed to 104 syslog.1:Oct 18 04:00:43 lemaker rsyslogd: rsyslogd's userid changed to 101 syslog.1:Oct 18 04:00:43 lemaker rsyslogd-2039: Could no open output pipe '/dev/xconsole': No such file or directory [try http://www.rsyslog.com/e/2039 ] 예상대로 수행되지 않는 것 외에는 무엇을 해야 할지 잘 모르겠습니다.

[편집 5] 아니면 작동이 중단되고 rsyslogd가 어딘가에서 문제가 발생하고 있다는 사실을 기록할 수도 있습니다. ...에서처럼 상관관계는 인과관계와 같지 않습니까? 마지막으로 업데이트된 로그는 /var/log에 있습니다. syslog, auth.log, kern.log는 모두 사용자 "syslog"에 의해 기록됩니다. 이는 rsyslogd tail kern.log에서 온 것 같습니다. Oct 18 20:43:59 lemaker kernel: [60223.243773] PHY: sunxi_gmac-0:00 - Link is Down Oct 18 20:44:12 lemaker kernel: [60236.244107] PHY: sunxi_gmac-0:00 - Link is Up - 100/Full Oct 18 20:44:22 lemaker kernel: [60246.244654] PHY: sunxi_gmac-0:00 - Link is Down Oct 18 20:44:36 lemaker kernel: [60260.245033] PHY: sunxi_gmac-0:00 - Link is Up - 100/Full Oct 18 20:45:12 lemaker kernel: [60296.246573] PHY: sunxi_gmac-0:00 - Link is Down Oct 18 20:45:25 lemaker kernel: [60309.246906] PHY: sunxi_gmac-0:00 - Link is Up - 100/Full Oct 18 20:45:57 lemaker kernel: [60341.248303] PHY: sunxi_gmac-0:00 - Link is Down Oct 18 20:46:10 lemaker kernel: [60354.248630] PHY: sunxi_gmac-0:00 - Link is Up - 100/Full Oct 18 20:46:16 lemaker kernel: [60360.249037] PHY: sunxi_gmac-0:00 - Link is Down Oct 18 20:46:30 lemaker kernel: [60374.249405] PHY: sunxi_gmac-0:00 - Link is Up - 100/Full

rsynclog를 다시 설치하고 비활성화했습니다. 아직도 예전처럼 얼어붙어 있어요. 내 생각에는 rsysnclog가 정지될 때 무언가를 기록하는 것 같지만 그게 문제가 아닙니다.상관관계는 인과관계와 같지 않기 때문에.

SSH를 통해 로그인하거나 웹 서버에 연결할 때 "정지"되는 것을 발견했기 때문에 문제는 링크 열기/링크 닫기일 수 있다고 생각했습니다. 이렇게 하면 정지된 것처럼 보일 수 있지만 실제로는 네트워크 링크일 뿐입니다.

답변1

나는 추천한다통계도구. 여기에는 문제가 발생하는 위치를 좁히는 데 도움이 되는 많은 플러그인("dstat --list"를 통해 나열)이 있습니다.

시작점은 아마도 가장 비용이 많이 드는 IO일 것입니다.

# dstat -s --top-io-adv --top-bio-adv
----swap--- -------most-expensive-i/o-process------- ----most-expensive-block-i/o-process----
 used  free|process               pid  read write cpu|process               pid  read write cpu
   0  4000M|chrome                3388  152k  97k0.6%|chrome                3388  155k  95k0.6%
   0  4000M|gnome-terminal-server 4635  586B  24k0.1%|chrome                3388    0   12k0.1%

에서:http://articles.slicehost.com/2010/11/12/using-dstat-to-check-io-and-swap

답변2

iotop하드 드라이브나 네트워크 작업으로 인해 지연이 발생한 경우 유틸리티에서 힌트를 제공할 수 있습니다.

답변3

CPU 시간별로 정렬을 실행 top하고 몇 초 이상 걸리는 처리를 기록해야 합니다. 그런 다음 정지가 발생한 후 다시 실행하여 top프로세스가 맨 위로 버블링되었는지 확인합니다.

특정 서비스(아파치?)가 의심되는 경우 해당 서비스를 중지하고 문제가 지속되는지 확인하세요. 일반적으로 topCPU 시간을 많이 소비하는 것으로 보고되는 중요하지 않은 프로세스를 모두 종료합니다 .

하드웨어 구성을 설명하는 것도 도움이 될 것입니다. 외부 하드웨어를 연결했습니까? 의 출력은 무엇입니까 lsmod? 마찬가지로, 필수적이지 않은 하드웨어를 모두 제거하고 관련 모듈을 비활성화하는 것이 도움이 될 수 있습니다.

마지막으로 성능을 평가할 때 이더넷을 사용하십시오(또는 로컬 터미널에 직접 연결하는 것이 더 좋습니다). WLAN은 더 복잡한 시스템이며 여러 곳에서 작동이 멈추는 경향이 있습니다. 예를 들어 장치의 연결이 끊어지고 자동으로 다시 연결되는 경우 WIFI에서 SSH가 정지되는 것처럼 보일 수 있습니다.

관련 정보