Ubuntu 22.04가 설치된 두 컴퓨터 사이에 추가 고대역폭 트래픽이 있을 때 대기 시간과 지터가 줄어드는 이유는 무엇입니까?

Question 1

네트워크 지연 시간과 지터를 줄이려면 트래픽에 관계없이 항상 CPU 부하를 늘리고, 어떤 경우에는 트래픽이 많은 상황에서 처리량을 줄이기도 한다고 합니다.

A/Ultimate Hammer: 바쁘게 투표하세요!(중요한 경고는 CPU가 적을수록 다른 영역에서 더 많은 희생이 따른다는 것입니다.)

아이디어는 일부 차단을 실행하고 잊어서 recvmsg다른 작업을 위해 CPU를 확보하는 대신 결국 CPU 캐시를 플러시하고 몇 가지 컨텍스트 전환과 Softirq 처리 후에 결국 작업으로 돌아간다는 것입니다.... 루프 네트워크 카드에서 무언가가 나오길 기다리느라 바쁩니다.
버퍼에서 데이터를 사용할 수 있게 되면 추가 지연 없이 처리됩니다.

man recvmsg이에 관련된 부분을 참고하고 읽어보시기 바랍니다MSG_기다리지 마세요배너. 또한 소켓을 열어도 비슷한 효과를 얻을 수 있습니다.O_비차단또한 폴링은 코어를 통해 구현될 수도 있지만 개인적으로 이 아이디어가 마음에 들지 않습니다. 왜냐하면... 코어가 2개 밖에 없기 때문입니다... ;-)

즉, 작업을 하나의 CPU에 고정하고 싶을 것입니다. 이렇게 하면 작업 마이그레이션 오버헤드가 방지되고 캐시를 핫하게 유지하는 데 도움이 됩니다.

이 접근 방식의 이점은 즉각적입니다! 처리량에 영향을 주지 않고 대기 시간과 지터를 최소화하지만... 공짜 점심 같은 것은 없기 때문에... 가능한 가장 높은 CPU 로드입니다.

B/낮은 수준의 네트워크 카드 조정(인터럽트 병합, 링 버퍼, 전송 큐...from ethtool)

- 버퍼:일반적으로 어떤 하위 시스템(네트워크/사운드/…) 버퍼든 대기 시간/지터의 적입니다. 따라서 이를 최소한으로 줄여야 합니다.
엄격한 최소값은 무엇입니까?
부하가 높을 때 패킷 손실 및/또는 오버플로가 시작됩니다(보고된 대로 ifconfig).

- 인터럽트 병합: 인터럽트 통합은 패킷이 호스트 메모리에 있기 때문에 패킷 도착 시간의 지연을 증가시키지만 호스트는 일정 시간이 지날 때까지 패킷을 인식하지 못합니다. 그러나 더 적은 수의 인터럽트가 생성되고 호스트가 인터럽트당 여러 패킷을 처리하므로 시스템은 더 적은 CPU 주기를 사용합니다.
따라서 CPU 시간과 처리량을 희생하면서 병합을 가능한 한 가장 낮은 정도로 줄이는 것이 흥미롭다는 것을 알 수 있습니다.

물론, 다음과 같은 경우에는 필요하지 않습니다.바쁜 폴링.
물론 관련 IRQ가 사용 가능한 모든 코어에 균등하게 분산되어 있는지 먼저 확인하지 않으면 다중 대기열 네트워크 카드에 거의 영향을 미치지 않습니다.
물론 시스템이 실행되고 있지 않으면 아무 효과가 없습니다.인터럽트 스레드IRQ 처리의 실제 작업은 실시간 스케줄링 정책을 따르는 전용 커널 스레드에 의해 수행되지 않기 때문입니다.

Answer