perf-event

Linux에서 Ftrace를 사용하여 예약 지연을 얻는 방법은 무엇입니까?
perf-event

Linux에서 Ftrace를 사용하여 예약 지연을 얻는 방법은 무엇입니까?

ftrace는 활성화되어 있지만 .ftrace는 활성화되지 않은 임베디드 Linux(kernel-5.10.24) 시스템을 개발 중입니다 perf. 시스템에서 추적을 확인한 결과 다음과 같은 정보를 얻었습니다. # ls /sys/kernel/tracing/events/sched/ -l total 0 -rw-r--r-- 1 root root 0 Jan 1 1970 enable -rw-r--r-- 1 root root 0 Jan 1 ...

Admin

내 컴퓨터에서 TLB에 대한 정보를 찾을 수 없거나 TLB의 하드웨어 카운터에 대한 정보를 얻을 수 없습니다
perf-event

내 컴퓨터에서 TLB에 대한 정보를 찾을 수 없거나 TLB의 하드웨어 카운터에 대한 정보를 얻을 수 없습니다

제가 사용하고 있는 우분투 버전은우분투 18.04.6 LTS, 커널 버전은5.4.0-148 일반. 내 프로세서는12세대 Intel(R) 코어(TM) i7-12700. 다양한 페이지 크기(1G, 2MB, 4KB)에 대해 내 CPU의 TLB 항목 수와 프로그램 실행 중 dTLB 누락 수를 알고 싶습니다. cpuid -1명령은 0이라고 알려줍니다. L1 TLB/cache information: 2M/4M pages & L1 TLB (0x80000005/eax): instructio...

Admin

perf를 사용하여 L3 캐시 미스율을 찾을 수 없습니다.
perf-event

perf를 사용하여 L3 캐시 미스율을 찾을 수 없습니다.

perf를 사용하려고 하면 L3 캐시 미스율을 얻으려고 합니다. 내가 실행한 명령은 다음과 같습니다. perf stat -e instructions,LLC-load-misses,LLC-loads ./program <arg1> <arg2> <arg3> 그러면 다음과 같은 결과가 나타납니다. 667,922,092,353 instructions <not suppo...

Admin

성능 통계와 함께 측정항목을 사용하는 방법
perf-event

성능 통계와 함께 측정항목을 사용하는 방법

성능 목록에는 소위 측정항목이 많이 표시됩니다. 목록은 다음으로 시작됩니다. List of pre-defined events (to be used in -e): Metrics: BAClear_Cost [Average Branch Address Clear Cost (fraction of cycles)] C2_Pkg_Residency [C2 residency percent per package] C3_Core_Residency [C3 residency ...

Admin

Archlinux, "kernel.perf_event_paranoid"는 존중되지 않습니다.
perf-event

Archlinux, "kernel.perf_event_paranoid"는 존중되지 않습니다.

CPUS에서 성능 카운터(PMC)를 읽을 때 다음 을 수행해야 합니다 kernel.perf_event_paranoid(<=1커널 문서) 아래 프로그램은 PMC를 읽고 1카운터를 열 수 없으면 일찍 종료해야 합니다. kernel.perf_event_paranoid즉 >1(뒤에서 확인 syscall) 나는 테스트했다 아치리눅스Linux host1 5.17.9-arch1-1 #1 SMP PREEMPT Wed, 18 May 2022 17:30:11 +0000 x86_64 GNU/Linux 우분투...

Admin

"perf"를 사용하여 벽시계 시간을 기준으로 스택 샘플을 얻는 방법
perf-event

"perf"를 사용하여 벽시계 시간을 기준으로 스택 샘플을 얻는 방법

저는 Linux perf_events프레임워크를 사용하여 우리 서버 중 하나에 있는 애플리케이션의 문제를 조사하려고 합니다. perf도구에 대해 읽은 내용에 따르면 스택을 수집하는 것은 비교적 간단합니다. 단순히 N초마다 스택을 수집하는 이벤트로 벽 시간을 사용할 수 있는지 궁금합니다. 현재 사용하고 있는 명령은 다음과 같습니다. perf record -e cycles -T -o <dir>/samples.data -F 1 --call-graph dwarf -T -p <pid> ...

Admin

성능 로깅/보고를 사용한 고주파 성능 카운터 샘플링
perf-event

성능 로깅/보고를 사용한 고주파 성능 카운터 샘플링

이 도구를 사용하여 높은 빈도(예: 100-200Hz)에서 성능 카운터 카운트를 검색하고 싶습니다 perf(예:https://github.com/RRZE-HPC/likwid/wiki/likwid-perfctr#the-timeline-mode그러나 더 자주). 이를 수행할 수 있는 방법이 있습니까? 그렇다면 perf record로깅 및 보고 결과를 사용할 때 어떤 플래그를 사용해야 합니까 perf report? sleep 5지금까지 실행 중 5ms 간격으로 r6d70 성능 카운터를 검색하기 위해 다음...

Admin

프로파일링에 사용되는 Perf 도구가 과부하 시 충돌함
perf-event

프로파일링에 사용되는 Perf 도구가 과부하 시 충돌함

로드 평균 중에 "perf Record -F 99 -g -p --sleep 300"을 사용하면 문제 없이 perf.data 파일을 얻을 수 있습니다. 하지만 부하가 높으면 충돌이 발생합니다. 좋은 결과를 얻는 유일한 방법은 빈도를 30 정도로 낮추는 것인데, 이는 끔찍한 일입니다. 이상적으로는 더 나은 결과를 얻으려면 속도가 더 높아야 합니다(~997 샘플/초). 이 문제를 해결할 방법이 있나요? 이 문제는 Linux 커널 공간과 관련이 있을 수 있다고 생각합니다. 그렇다면 이 문제를 해결하려면 ...

Admin

`perf stat` 옵션 `--cpu`는 실제로 무엇을 표시합니까?
perf-event

`perf stat` 옵션 `--cpu`는 실제로 무엇을 표시합니까?

--cpu옵션을 이해하려고 노력 중입니다 perf-stat. 매뉴얼 페이지에는 다음과 같이 나와 있습니다. 제공된 CPU 목록에만 의존하십시오. 여러 CPU를 공백 없이 쉼표로 구분된 목록(0,1)으로 제공할 수 있습니다. CPU 범위는 -: 0-2로 지정됩니다. 스레드별 모드에서는 이 옵션이 무시됩니다. 시스템 전체 모니터링을 활성화하려면 -a 옵션이 여전히 필요합니다. 기본값은 모든 CPU를 사용하는 것입니다. 이 옵션을 사용하여 프로그램이 실행될 CPU를 제어할 수 있습니까? 를 입력...

Admin

폴리스티렌
perf-event

폴리스티렌

수색무엇Linux에서 모니터링이 가능한가요 ? perf_events무엇을 찾을 수 없나요 Kernel PMU event? 즉, 다음 과 같은 perf version 3.13.11-ckt39프로그램 이벤트가 있습니다.perf list branch-instructions OR cpu/branch-instructions/ [Kernel PMU event] 일반적으로 말하면 다음과 같습니다. Tracepoint event Software event Hardware event Hardware ca...

Admin

perf는 매우 큰 프로세스에서는 작동하지 않습니다.
perf-event

perf는 매우 큰 프로세스에서는 작동하지 않습니다.

나는 내 애플리케이션을 프로파일링하기 위해 자주 perf를 사용합니다. 나는 최근에 각각 ~750G RAM을 갖춘 몇 대의 새로운 컴퓨터를 구입했습니다. 나는 이들 중 하나에서 약 400G의 메모리를 사용하는 프로세스를 프로파일링하려고 합니다. 이것은 하나를 제외한 모든 새로운 컴퓨터에서 잘 작동합니다. 우분투를 실행하면서 모두 같은 방식으로 설치됩니다. 직접 perf설치 하고 컴파일해 보았습니다 .apt-get자식에서. 실행할 때 ./perf top -p 14182가끔 결과를 얻을 수 있지만(오...

Admin

-fno-omit-frame-pointer로 컴파일했는데도 perf_event의 성능 보고서에 스택 기호가 누락되었습니다.
perf-event

-fno-omit-frame-pointer로 컴파일했는데도 perf_event의 성능 보고서에 스택 기호가 누락되었습니다.

해당 주제에 대한 많은 튜토리얼을 읽고 필요한 모든 작업을 수행했음에도 불구하고 기호가 포함된 스택 추적을 제공하는 perf_events를 얻는 데 여전히 어려움을 겪고 있습니다. 로컬에 설치된 성능(자세한 내용은 아래 참조)에 어떤 방식으로든 결함이 있을 수 있습니까? 어쨌든, 내가 한 일은 다음과 같다. main.cpp는 동일한 파일에 정의된 몇 가지 함수를 호출하고 일부 메모리를 할당하고 해제한 다음 무언가를 인쇄하는 간단한 C++ 프로그램입니다. 컴파일 명령: gcc -std=c++11 ...

Admin

성능 목록에서 하드웨어 캐시 이벤트를 찾을 수 없는 이유는 무엇입니까?
perf-event

성능 목록에서 하드웨어 캐시 이벤트를 찾을 수 없는 이유는 무엇입니까?

새로 구입한 노트북에서 Linux 성능을 사용하는 데 문제가 있습니다. 성능 목록에 사용할 수 있는 하드웨어 캐시 효과가 없습니다! 글쎄요, 제가 샘플링하고 싶었던 훌륭한 정보는 말 그대로 전부였습니다! 내 성과 목록은 다음과 같습니다. List of pre-defined events (to be used in -e): cpu-cycles OR cycles [Hardware event] instructions ...

Admin

성능 커널 카운터가 작동하는 데 문제가 있습니다.
perf-event

성능 커널 카운터가 작동하는 데 문제가 있습니다.

나는 "perf_event_create_kernel_counter" API를 통해 성능 카운터를 생성한 다음 주기적으로 그 값을 읽는 커널 모듈을 작성했습니다. 내 응용 프로그램은 커널 버전 4.0.9(및 이전 개정판)에서는 작동하지만 커널 버전 4.1(이상)에서는 작동하지 않습니다. 기본적으로 커널의 후속 버전에서는 소프트웨어 카운터(예: PERF_COUNT_SW_CPU_CYCLES)만 읽을 수 있지만 하드웨어 카운터(예: PERF_COUNT_HW_CACHE_MISSES)는 읽을 수 없습니다. ...

Admin