얼마 전 Fedora 20을 실행하는 컴퓨터에 GeForce GTX 970을 설치했습니다. 이해해야 할 중요한 점은 이 카드를 그래픽용이 아닌 가속기로만 사용한다는 것입니다. 최근까지는 잘 작동했습니다. 그러나 .cu
실행 파일을 시작하려고 할 때 다음 문제가 발생했습니다.
modprobe: FATAL: Module nvidia not found.
bug.cu (16): no CUDA-capable device is detected in cudaMalloc((void **)&p, sizeof(int))
유사한 사례를 Google에서 검색한 결과 메시지가 modprobe
(소위 연결 가능한 커널 모듈을 관리하는 사람이 누구든지) 특정 LKM(nvidia)을 찾을 수 없거나 더 간단하게는 드라이버에 문제가 있는 것으로 해석될 수 있음을 발견했습니다.
그런 다음 다음을 통해 추가 조사를 수행했습니다.
$ lspci -k | grep -A 2 -i "VGA"
01:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] (rev a1)
Subsystem: Micro-Star International Co., Ltd. [MSI] Device 3171
Kernel modules: nouveau
포럼에서 나는 두 개의 다른 NVidia LKM이 존재한다는 것을 읽었습니다(그리고 아마도 위에 주어진 출력에 있어야 할 것입니다): 보시 nvidia
다시피 nvidiafb
, 내 시스템에는 없습니다.
내 질문은 다음과 같습니다. 이것이 반드시 이러한 모듈이 전혀 없다는 것을 의미합니까? 아니면 항상 거기에 있을 필요는 없고 필요할 때만 커널에 연결되는 경우가 있을까요?
드라이버를 다시 설치해야 하나요? 아니면 이 모듈이 어떻게든 비활성화되어 어떻게든 활성화해야 할까요?
답변1
드라이버를 재설치하여 문제를 해결했습니다.
먼저 재설치를 시도했지만 yum
(원래 이런 방식으로 설치되었기 때문에) 도움이 되지 않았습니다. 그래서 삭제하고 NVidia에서 드라이버를 다운로드했습니다.공식 인용. 설치 기준은이것지침.
그 후에는 모든 것이 잘 작동합니다. LKM의 경우:
$ lspci -k | grep -A 2 -i "VGA"
01:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] (rev a1)
Subsystem: Micro-Star International Co., Ltd. [MSI] Device 3171
Kernel driver in use: nvidia