원래 질문

Question

콘텐츠 알림: 이 문서에는 다양한 Linux 토론 및 코드에 대한 링크가 포함되어 있습니다. 일부 링크된 콘텐츠가 현행 행동강령을 준수하지 않습니다.스택 교환또는리눅스. 대부분 그들은 "[사람이 아닌] 코드를 모욕합니다." 사용된 언어에 관계없이 반복해서는 안 됩니다. 그러한 언어를 모방하거나 앵무새처럼 흉내내거나 논쟁을 벌이는 일을 삼가해 주시기 바랍니다.

Re: iowait가 유휴 계정과 "일관되지 않음" - iowait가 너무 낮음

2019년 5월 7일 12:38에 Peter Zijlstra는 다음과 같이 썼습니다.

2019년 7월 5일 금요일 오후 12시 25분 46초 +0100에 Alan Jenkins가 다음과 같이 썼습니다.

내 CPU "iowait" 시간이 잘못 보고된 것 같습니다. 왜 이런 일이 일어나는지 아십니까?

iowait는 마법의 난수이고 의미가 없기 때문입니다. 개인적으로 저는 이 부분을 제외하고는 전부 삭제하고 싶습니다.ABI:/

주변 리뷰도 확인하세요nr_iowait()

감사해요. [현재 문서에 언급된 문제]는 다른 질문이라고 생각하지만, 내 문제를 "해결"하기 위한 요구 사항(또는 포인트)이 많지 않다는 뜻입니다.

내 문제를 발견했습니다. 이 문제는 5년 전에 알려졌는데 이를 고치는 것은 쉬운 일이 아니다.

"iowait" 시간은 다음 함수에 의해 업데이트됩니다 account_idle_time().

/*
 * Account for idle time.
 * @cputime: the CPU time spent in idle wait
 */
void account_idle_time(u64 cputime)
{
    u64 *cpustat = kcpustat_this_cpu->cpustat;
    struct rq *rq = this_rq();

    if (atomic_read(&rq->nr_iowait) > 0)
        cpustat[CPUTIME_IOWAIT] += cputime;
    else
        cpustat[CPUTIME_IDLE] += cputime;
}

이것은 내가 기대했던 대로 작동합니다.대략적인 CPU 시간"샘플링"은 전통적인 타이머 인터럽트("틱")를 사용하여 수행됩니다. 단, 절전을 위해 유휴 시간 동안 체크를 꺼두면 작동하지 않을 수 있습니다 NO_HZ_IDLE. 성능상의 이유로 틱을 끄도록 허용하는 경우에도 실패할 수 있습니다. NO_HZ_FULL부팅이 필요하기 때문입니다.VIRT_CPU_ACCOUNTING. 대부분의 Linux 커널은 절전 기능을 사용합니다. 일부 임베디드 시스템에서는 이 두 가지 기능을 사용하지 않습니다. 내 설명은 다음과 같습니다.

IO가 완료되면 장치는방해하다. 커널 인터럽트 핸들러는 다음을 사용하여 프로세스를 깨웁니다.try_to_wake_up(). 카운터를 1씩 감소시킵니다 nr_iowait.

if (p->in_iowait) {
    delayacct_blkio_end(p);
    atomic_dec(&task_rq(p)->nr_iowait);
}

프로세스가 유휴 CPU에서 깨어나는 경우 해당 CPU는 account_idle_time()애플리케이션 구성에 따라 tick_nohz_account_idle_ticks()에서 __tick_nohz_idle_restart_tick()또는 vtime_task_switch()에서 호출됩니다 finish_task_switch().

이때는 ->nr_iowait축소되었습니다. 0으로 줄이면 iowait 시간이 기록되지 않습니다.

이 효과는 다양할 수 있습니다. 즉, 프로세스가 깨어난 CPU에 따라 다릅니다. IO 완료 인터럽트를 수신하는 동일한 CPU에서 프로세스가 깨어나는 경우 ->nr_iowait유휴 시간이 줄어들기 전에 더 일찍 계산될 수 있습니다. 내 경우에는 CPU 0이 처리된 것으로 나타났습니다.아치을 보고 중단합니다 watch cat /proc/interrupts.

간단한 순차 읽기로 이것을 테스트했습니다.

dd if=largefile iflag=direct bs=1M of=/dev/null

명령을 CPU 0 에 고정하면 taskset -c 0 ...iowait에 대한 "올바른" 값이 표시됩니다. 다른 CPU에 고정하면 더 낮은 값이 표시됩니다. 명령을 정상적으로 실행하면 커널 버전 간에 변경된 스케줄러 동작에 따라 변경됩니다. 최근 커널(4.17, 5.1, 5.2-rc5-ish)에서는 "iowait" 시간이 이 부분으로 줄어들기 때문에 이 명령은 CPU 0에서 시간의 약 1/4이 걸리는 것으로 보입니다.

(설명되지 않음: 이제 내 가상 머신에서 이 테스트를 실행하면 각(또는 모든) CPU에 대해 "올바른" iowait가 재현되는 것처럼 보입니다. 이것이 관련되었을 수 있다고 생각됩니다.IRQ_TIME_ACCOUNTING, 이 기능은 가상 머신 외부 테스트에도 사용되었습니다.

NO_HZ_IDLE억제하면 4.17+에서는 CPU당 "올바른" iowait가 제공되지만 4.16 또는 4.15에서는 제공되지 않는 이유를 정확히 확인하지 못했습니다 .

내 가상 머신에서 이 테스트를 실행하면 각 CPU에 대해 "올바른" iowait가 재현되는 것 같습니다. 이 때문입니다 IRQ_TIME_ACCOUNTING. VM 외부 테스트에도 사용되지만 VM 내부에서 테스트할 때 더 많은 중단이 발생합니다. 특히 "dd"가 실행 중인 가상 CPU에는 초당 1000개가 넘는 "함수 호출 인터럽트"가 있습니다.

그러니 제 설명의 세부사항에 너무 의존하시면 안 됩니다 :-)

"iowait"에 대한 배경 정보는 다음과 같습니다.CPU는 IO가 보류 중인지 어떻게 알 수 있나요? 여기에 대한 답변은 누적된 iowait가 "특정 조건에서 감소될 수 있다"는 반직관적인 아이디어를 인용합니다. 내 간단한 테스트가 문서화되지 않은 상황을 유발할 수 있는지 궁금합니다.

예.

처음 이 내용을 검색했을 때 "딸꾹질"이라는 용어를 발견했습니다. 또한 누적된 "iowait" 시간이 단조롭지 않음을 보여줌으로써 문제를 설명합니다. 즉, 뒤로 점프(감소)하는 경우도 있습니다. 위의 테스트만큼 간단하지는 않습니다.

그러나 조사를 해보니 동일한 근본적인 문제가 발견되었습니다. Peter Zijlstra와 Hidetoshi Seto는 각각 솔루션을 제안하고 프로토타입을 제작했습니다. 이 문제는 표지 메시지에 설명되어 있습니다.

[RFC 패치 0/8] iowait 회계 재작업(2014-07-07)

그 외에는 진전이 있다는 증거를 찾지 못했습니다. 세부 사항 중 하나에 답이 없는 질문이 있습니다. 또한 전체 시리즈는 PowerPC, S390 및 IA64 CPU 아키텍처에 대한 특정 코드를 다룹니다. 그래서 이 문제를 해결하는 것이 쉽지 않다고 말씀드리고 싶습니다.

Answer 1

콘텐츠 알림: 이 문서에는 다양한 Linux 토론 및 코드에 대한 링크가 포함되어 있습니다. 일부 링크된 콘텐츠가 현행 행동강령을 준수하지 않습니다.스택 교환또는리눅스. 대부분 그들은 "[사람이 아닌] 코드를 모욕합니다." 사용된 언어에 관계없이 반복해서는 안 됩니다. 그러한 언어를 모방하거나 앵무새처럼 흉내내거나 논쟁을 벌이는 일을 삼가해 주시기 바랍니다.

Re: iowait가 유휴 계정과 "일관되지 않음" - iowait가 너무 낮음

2019년 5월 7일 12:38에 Peter Zijlstra는 다음과 같이 썼습니다.

2019년 7월 5일 금요일 오후 12시 25분 46초 +0100에 Alan Jenkins가 다음과 같이 썼습니다.

내 CPU "iowait" 시간이 잘못 보고된 것 같습니다. 왜 이런 일이 일어나는지 아십니까?

iowait는 마법의 난수이고 의미가 없기 때문입니다. 개인적으로 저는 이 부분을 제외하고는 전부 삭제하고 싶습니다.ABI:/

주변 리뷰도 확인하세요nr_iowait()

감사해요. [현재 문서에 언급된 문제]는 다른 질문이라고 생각하지만, 내 문제를 "해결"하기 위한 요구 사항(또는 포인트)이 많지 않다는 뜻입니다.

내 문제를 발견했습니다. 이 문제는 5년 전에 알려졌는데 이를 고치는 것은 쉬운 일이 아니다.

"iowait" 시간은 다음 함수에 의해 업데이트됩니다 account_idle_time().

/*
 * Account for idle time.
 * @cputime: the CPU time spent in idle wait
 */
void account_idle_time(u64 cputime)
{
    u64 *cpustat = kcpustat_this_cpu->cpustat;
    struct rq *rq = this_rq();

    if (atomic_read(&rq->nr_iowait) > 0)
        cpustat[CPUTIME_IOWAIT] += cputime;
    else
        cpustat[CPUTIME_IDLE] += cputime;
}

이것은 내가 기대했던 대로 작동합니다.대략적인 CPU 시간"샘플링"은 전통적인 타이머 인터럽트("틱")를 사용하여 수행됩니다. 단, 절전을 위해 유휴 시간 동안 체크를 꺼두면 작동하지 않을 수 있습니다 NO_HZ_IDLE. 성능상의 이유로 틱을 끄도록 허용하는 경우에도 실패할 수 있습니다. NO_HZ_FULL부팅이 필요하기 때문입니다.VIRT_CPU_ACCOUNTING. 대부분의 Linux 커널은 절전 기능을 사용합니다. 일부 임베디드 시스템에서는 이 두 가지 기능을 사용하지 않습니다. 내 설명은 다음과 같습니다.

IO가 완료되면 장치는방해하다. 커널 인터럽트 핸들러는 다음을 사용하여 프로세스를 깨웁니다.try_to_wake_up(). 카운터를 1씩 감소시킵니다 nr_iowait.

if (p->in_iowait) {
    delayacct_blkio_end(p);
    atomic_dec(&task_rq(p)->nr_iowait);
}

프로세스가 유휴 CPU에서 깨어나는 경우 해당 CPU는 account_idle_time()애플리케이션 구성에 따라 tick_nohz_account_idle_ticks()에서 __tick_nohz_idle_restart_tick()또는 vtime_task_switch()에서 호출됩니다 finish_task_switch().

이때는 ->nr_iowait축소되었습니다. 0으로 줄이면 iowait 시간이 기록되지 않습니다.

이 효과는 다양할 수 있습니다. 즉, 프로세스가 깨어난 CPU에 따라 다릅니다. IO 완료 인터럽트를 수신하는 동일한 CPU에서 프로세스가 깨어나는 경우 ->nr_iowait유휴 시간이 줄어들기 전에 더 일찍 계산될 수 있습니다. 내 경우에는 CPU 0이 처리된 것으로 나타났습니다.아치을 보고 중단합니다 watch cat /proc/interrupts.

간단한 순차 읽기로 이것을 테스트했습니다.

dd if=largefile iflag=direct bs=1M of=/dev/null

명령을 CPU 0 에 고정하면 taskset -c 0 ...iowait에 대한 "올바른" 값이 표시됩니다. 다른 CPU에 고정하면 더 낮은 값이 표시됩니다. 명령을 정상적으로 실행하면 커널 버전 간에 변경된 스케줄러 동작에 따라 변경됩니다. 최근 커널(4.17, 5.1, 5.2-rc5-ish)에서는 "iowait" 시간이 이 부분으로 줄어들기 때문에 이 명령은 CPU 0에서 시간의 약 1/4이 걸리는 것으로 보입니다.

(설명되지 않음: 이제 내 가상 머신에서 이 테스트를 실행하면 각(또는 모든) CPU에 대해 "올바른" iowait가 재현되는 것처럼 보입니다. 이것이 관련되었을 수 있다고 생각됩니다.IRQ_TIME_ACCOUNTING, 이 기능은 가상 머신 외부 테스트에도 사용되었습니다.

NO_HZ_IDLE억제하면 4.17+에서는 CPU당 "올바른" iowait가 제공되지만 4.16 또는 4.15에서는 제공되지 않는 이유를 정확히 확인하지 못했습니다 .

내 가상 머신에서 이 테스트를 실행하면 각 CPU에 대해 "올바른" iowait가 재현되는 것 같습니다. 이 때문입니다 IRQ_TIME_ACCOUNTING. VM 외부 테스트에도 사용되지만 VM 내부에서 테스트할 때 더 많은 중단이 발생합니다. 특히 "dd"가 실행 중인 가상 CPU에는 초당 1000개가 넘는 "함수 호출 인터럽트"가 있습니다.

그러니 제 설명의 세부사항에 너무 의존하시면 안 됩니다 :-)

"iowait"에 대한 배경 정보는 다음과 같습니다.CPU는 IO가 보류 중인지 어떻게 알 수 있나요? 여기에 대한 답변은 누적된 iowait가 "특정 조건에서 감소될 수 있다"는 반직관적인 아이디어를 인용합니다. 내 간단한 테스트가 문서화되지 않은 상황을 유발할 수 있는지 궁금합니다.

예.

처음 이 내용을 검색했을 때 "딸꾹질"이라는 용어를 발견했습니다. 또한 누적된 "iowait" 시간이 단조롭지 않음을 보여줌으로써 문제를 설명합니다. 즉, 뒤로 점프(감소)하는 경우도 있습니다. 위의 테스트만큼 간단하지는 않습니다.

그러나 조사를 해보니 동일한 근본적인 문제가 발견되었습니다. Peter Zijlstra와 Hidetoshi Seto는 각각 솔루션을 제안하고 프로토타입을 제작했습니다. 이 문제는 표지 메시지에 설명되어 있습니다.

[RFC 패치 0/8] iowait 회계 재작업(2014-07-07)

그 외에는 진전이 있다는 증거를 찾지 못했습니다. 세부 사항 중 하나에 답이 없는 질문이 있습니다. 또한 전체 시리즈는 PowerPC, S390 및 IA64 CPU 아키텍처에 대한 특정 코드를 다룹니다. 그래서 이 문제를 해결하는 것이 쉽지 않다고 말씀드리고 싶습니다.

원래 질문

원래 질문

"iowait"에 대한 배경 정보

환경

테스트 및 결과

테스트 결과(가상머신 내부)

답변1

관련 정보