커널 모듈 "nvidia-drm"을 제거하는 방법은 무엇입니까?

커널 모듈 "nvidia-drm"을 제거하는 방법은 무엇입니까?

Debian Stretch에 최신 NVIDIA 드라이버를 설치하려고 합니다. NVIDIA-Linux-x86_64-390.48.run다운로드에서 다운로드했습니다.여기, 하지만 내가 하려고 하면

sudo sh ./NVIDIA-Linux-x86_64-390.48.run

제안된 대로 오류 메시지가 나타납니다.

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel.  This may be because it is in use (for example, by an X server, a CUDA program, or 
         the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading.  Please be sure to exit any programs    
         that may be using the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your kernel supports module unloading,   
         and you still receive this message, then an error may have occured that has corrupted an NVIDIA kernel module's usage count, for which the simplest remedy is to     
         reboot your computer.

nvidia-drm(또는 ) 을 사용하고 있는 사람이 누구인지 알아내려고 하면 nvidia_drm아무것도 표시되지 않습니다.

~$ sudo lsof | grep nvidia-drm
lsof: WARNING: can't stat() fuse.gvfsd-fuse file system /run/user/1000/gvfs
      Output information may be incomplete.
~$ sudo lsof -e /run/user/1000/gvfs | grep nvidia-drm
~$

삭제하려고 하면 사용중이라고 뜹니다.

~$ sudo modprobe -r nvidia-drm
modprobe: FATAL: Module nvidia_drm is in use.
~$ 

재부팅하고 일반 텍스트 모드(사용자 이름/비밀번호를 제공하기 전에 Ctrl+Alt+F2)로 시작했지만 동일한 오류가 발생합니다.

그 외에도 "내 커널이 모듈 언로드를 지원하는지" 어떻게 알 수 있나요?

부팅 시 NVIDIA 관련 경고가 표시되지만 관련이 있는지는 알 수 없습니다.

Apr 30 00:46:15 debian-9 kernel: nvidia: loading out-of-tree module taints kernel.
Apr 30 00:46:15 debian-9 kernel: nvidia: module license 'NVIDIA' taints kernel.
Apr 30 00:46:15 debian-9 kernel: Disabling lock debugging due to kernel taint
Apr 30 00:46:15 debian-9 kernel: NVRM: loading NVIDIA UNIX x86_64 Kernel Module  375.82  Wed Jul 19 21:16:49 PDT 2017 (using threaded interrupts)

답변1

디스플레이 관리자를 중지하고 싶은 것 같은데, Nvidia 드라이버를 사용할 것 같습니다.

텍스트 콘솔로 변경하고( Ctrl+ Alt+ 누르기 F2) 루트로 로그인한 후 다음 명령을 사용하여 그래픽 대상을 비활성화하여 디스플레이 관리자를 계속 실행합니다.

# systemctl isolate multi-user.target

이제 다음을 사용하여 modprobe -r(또는 직접) rmmodNvidia 드라이버를 제거 할 수 있기를 바랍니다.

# modprobe -r nvidia-drm

성공적으로 교체/업그레이드하고 그래픽 환경을 다시 시작할 준비가 되면 다음 명령을 사용할 수 있습니다.

# systemctl start graphical.target

답변2

쿠다 설치

1) 최신 버전을 다운로드하세요CUDA 툴킷

2) Ctl+Alt+F3을 눌러 tty3으로 전환합니다.

3) 계속하기 전에 nvidia-drm을 제거하십시오.

3a) 다중 사용자 대상 격리

sudo systemctl isolate multi-user.target

3b) nvidia-drm이 현재 사용 중이라는 점에 유의하세요.

lsmod | grep nvidia.drm

3c) nvidia-drm 제거

sudo modprobe -r nvidia-drm

4d) nvidia-drm은 더 이상 사용되지 않습니다.

lsmod | grep nvidia.drm

5) 다운로드 폴더로 이동하여 cuda install을 실행하세요.

sudo sh cuda_10.1.168_418.67_linux.run

6) 설치 과정 중 프롬프트에 응답합니다.

7) 설치가 완료되면 CUDA 버전이 업데이트 되었는지 확인하세요.

nvidia-smi

8) GUI를 다시 시작하십시오.

sudo systemctl start graphical.target

답변3

GUI를 비활성화하고, 재부팅하고, 로그인하고 드라이버를 설치하고, GUI를 활성화하고 재부팅하여 이 문제를 해결했습니다.

사용자 이름과 비밀번호를 꼭 알아두시기 바랍니다!

터미널을 열고 쓰세요

sudo systemctl set-default multi-user.target
sudo reboot 0

지금 로그인하시면 바로 터미널로 이동하여 드라이버를 설치하게 됩니다. 여기서 제가 설치한 것은 440.44 입니다.따라서 드라이버 버전을 수정해야 합니다..

sudo ./NVIDIA-Linux-x86_64-440.44.run

드라이버를 설치한 후 GUI를 활성화하고 재부팅합니다.

sudo systemctl set-default graphical.target
sudo reboot 0

너는 끝내야 해

제 경우에는 nvidia-smi가 새 버전 440.44를 보고하고 Ubuntu 18.04 소프트웨어 및 업데이트 유틸리티에서 불만을 표시했으며 추가 드라이버 탭에 435가 표시되었습니다! 또 다른 NVIDIA 미스테리지만 제 새 도커는 실제로 작동합니다! ! !

답변4

비슷한 문제가 있습니다.

*원인: nvidia.drm 패키지가 사용 중입니다.


모든 NVIDIA 패키지를 삭제하여 문제를 해결했습니다.

이전 NVIDIA 설치를 모두 제거하려면 다음 2개의 명령을 사용하십시오.


$ sudo apt-get purge nvidia*
$ sudo apt-get autoremove

모듈을 제거해야 합니다.

재부팅하고 계속하십시오.

관련 정보