1마이크로초 미만의 대기 시간이 긴 콘텐츠를 측정하기 위한 DPROBES(DTRACE_PROBE)

Question

usleep(1) 측정: 평균 = 53962나노초

코드 순서는 다음과 같습니다.

   DTRACE_PROBE("hello-usdt", probe-main-start);
   usleep(1);
   DTRACE_PROBE("hello-usdt", probe-main-end);

문제의 프로세스는 절전 요청 후 예약될 가능성이 높습니다.
따라서 다음 DTRACE_PROBE는 관련 프로세스가 다시 예약될 때만 실행됩니다. 따라서 측정은 소요된 클록 시간을 안정적으로 측정하지 않고 usleep(1)1μs 절전 시간 + 시스템 활동에 따른 가변 시간을 측정합니다. 후자는 어떤 경우에도 1μs보다 훨씬 낫습니다.
위험을 무릅쓰자... 50배 더... 평균 약 50μs ;-)
비실시간 환경에서는 이 측정 항목의 표준 편차가 꽤 높은 것 같습니다.

측정된 오버헤드: 평균 = 788나노초.
오버헤드로 모든 측정에서 788나노초를 뺄 수 있습니까?

귀하의 접근 방식이 DTRACE_PROBE로 인한 오버헤드를 측정한다는 점을 인정합니다.
그럼에도 불구하고, 모든 측정 작업에서와 마찬가지로 표준 편차를 먼저 고려하십시오. 표준편차가 높을수록 평균의 의미가 떨어지기 때문입니다.
표준편차에 만족한다면, 그렇습니다. 측정값에서 평균을 뺍니다.
하지만... 음... < 1 µs에 대해 이야기하고 있는 걸까요?

또 다른 예 nanosleep(200) :avg = 52563 나노초

무엇? 다시 말하지만...약 50μs의 드리프트? 얼마나 이상합니까?
내 대답의 첫 번째 부분 nanosleep도 적용됩니다. 충분하지 않다면 참조하세요.nanosleep수동:

또한 절전 모드가 완료된 후에도 호출 스레드를 실행하기 위해 CPU가 다시 사용 가능해질 때까지는 여전히 지연이 있을 수 있습니다.

이 방법을 사용하면 0.8 마이크로초 미만의 어떤 것도 측정할 수 없습니까? 또한 nanosleep(200)이 50usec만큼 "늦잠"을 했다는 것을 믿을 수 없습니다.

위에 쓰여진 모든 내용을 읽은 후에 마지막 질문에 대한 답을 찾았기를 바랍니다. 이 질문은 또한 이전 질문에 대한 답도 제공합니다.

아니요! 이 방법을 사용하여 800ns 미만의 어떤 것도 측정할 수 없는 것은 아닙니다.
그러나 시스템 활동 및 하드웨어 성능으로 인해 다음 작업만 수행할 수 있습니다.차단 통화에 소요된 시계 시간을 측정합니다.(어떤 호출이든지 스케줄러가 즉시 프로세스를 예약하도록 트리거합니다.) 정확도는 약 50μs보다 좋습니다.

Answer 1