나는 이 행동이 perf top -e cache-misses:pp -p <my_pid>
매우 혼란스럽다고 생각합니다. 커널 4.4.5 64비트를 실행하는 Intel i5-3230M이 있습니다.
해당 명령을 실행하면 기본적으로 애플리케이션에서 샘플을 얻지 못하지만(큰 데이터 세트를 사용한 수치 시뮬레이션이므로 캐시 누락이 확실히 표시되어야 함) 거의 몇 가지 커널 함수에서만 얻을 intel_pmu_lbr_enable_all
수 native_write_msr_safe
있습니다 native_read_msr_safe
. __intel_pmu_lbr_disable
. 사용자 공간에 대한 클릭 제한을 사용하면 -K
내 앱에서만 클릭이 발생하지만 그 수치는 매우 낮습니다. "정확한"( ) 수정자를 제거하면 p
더 많은 적중이 발생하지만 opcode의 적중으로 인해 메모리 로드/쓰기가 발생하지 않습니다.
이 행동을 어떻게 설명할 수 있나요? "캐시 누락"으로 간주되는 것은 정확히 무엇입니까?