Linux 커널 관점에서 볼 때 사용자 프로그램은 CUDA GPU와 어떻게 통신합니까?

Question

애플리케이션은 시작 시 커널에서 mmap버퍼 세트를 요청하며 이 맵을 생성하는 것은 권한 있는 작업입니다.

일반 작업은 단순히 이러한 버퍼를 데이터(예: 텍스처, 정점 또는 명령)로 채우고 마지막으로 단일 커널 호출을 수행하여 제출된 명령 대기열을 시작합니다. 이 시동 스트로브는 수행되는 유일한 레지스터 액세스이며, 그 밖의 모든 것은 공유 메모리입니다.

GPU에는 필요한 경우를 제외하고 명령이 다른 컨텍스트에 속하는 데이터를 참조할 수 없도록 자체 기본 MMU가 있습니다(예: 게임의 렌더 대상을 오버레이의 렌더 대상과 결합하고 결과를 로컬에 쓰는 합성기) 화면 버퍼).

컴퓨팅 전용 워크로드의 경우 동일한 메커니즘이 잘 작동합니다. 명령 대기열은 "데이터를 화면으로 보내기"로 끝나지 않고 "호스트로 데이터 반환"으로 끝납니다.

Answer 1

애플리케이션은 시작 시 커널에서 mmap버퍼 세트를 요청하며 이 맵을 생성하는 것은 권한 있는 작업입니다.

일반 작업은 단순히 이러한 버퍼를 데이터(예: 텍스처, 정점 또는 명령)로 채우고 마지막으로 단일 커널 호출을 수행하여 제출된 명령 대기열을 시작합니다. 이 시동 스트로브는 수행되는 유일한 레지스터 액세스이며, 그 밖의 모든 것은 공유 메모리입니다.

GPU에는 필요한 경우를 제외하고 명령이 다른 컨텍스트에 속하는 데이터를 참조할 수 없도록 자체 기본 MMU가 있습니다(예: 게임의 렌더 대상을 오버레이의 렌더 대상과 결합하고 결과를 로컬에 쓰는 합성기) 화면 버퍼).

컴퓨팅 전용 워크로드의 경우 동일한 메커니즘이 잘 작동합니다. 명령 대기열은 "데이터를 화면으로 보내기"로 끝나지 않고 "호스트로 데이터 반환"으로 끝납니다.

관련 정보