perf -e 캐시 미스:pp를 해석하는 방법은 무엇입니까?

perf -e 캐시 미스:pp를 해석하는 방법은 무엇입니까?

나는 이 행동이 perf top -e cache-misses:pp -p <my_pid>매우 혼란스럽다고 생각합니다. 커널 4.4.5 64비트를 실행하는 Intel i5-3230M이 있습니다.

해당 명령을 실행하면 기본적으로 애플리케이션에서 샘플을 얻지 못하지만(큰 데이터 세트를 사용한 수치 시뮬레이션이므로 캐시 누락이 확실히 표시되어야 함) 거의 몇 가지 커널 함수에서만 얻을 intel_pmu_lbr_enable_allnative_write_msr_safe있습니다 native_read_msr_safe. __intel_pmu_lbr_disable. 사용자 공간에 대한 클릭 제한을 사용하면 -K내 앱에서만 클릭이 발생하지만 그 수치는 매우 낮습니다. "정확한"( ) 수정자를 제거하면 p더 많은 적중이 발생하지만 opcode의 적중으로 인해 메모리 로드/쓰기가 발생하지 않습니다.

이 행동을 어떻게 설명할 수 있나요? "캐시 누락"으로 간주되는 것은 정확히 무엇입니까?

관련 정보