업그레이드 후 부팅이 멈춤

업그레이드 후 부팅이 멈춤

내 GPU는엔비디아 - 지포스 RTX 3090 Ti, 운영 체제는우분투18.04. 내 코드가 실행되지 않았기 때문에 Python, pytorch, cuda 및 cudnn의 버전을 확인했습니다.

  • 파이썬: 3.6
  • 토치. 버전: 1.4.0
  • torch.version.cuda: 10.1 (nvidia-smi는 CUDA 버전 11.3을 보여줍니다)
  • 쿠데른: 7.6.3

3090 Ti와 호환되지 않습니다. 성공적으로 업그레이드했습니다.파이썬을 3.9로, 그리고Pytorch를 1.12.1+cu102로. 그러나 "pip3 install cuda-python" 및 "pip install nvidia-cudnn"은 작동하지 않습니다. 그래서 홈페이지에 나온대로 따라해봤습니다.

설치 단계가 완료되면 nvidia-smi에 "NVML을 초기화할 수 없습니다: 드라이버/라이브러리 버전 불일치"가 표시됩니다. 다시 시작해도 효과가 있었지만 시스템이 다시 시작 단계에서 멈췄습니다.

dpkg -l |grep nvidia

iU libnvidia-cfg1-520:amd64 520.61.05-0ubuntu1 amd64 NVIDIA binary OpenGL/GLX configuration library
ii libnvidia-common-465 465.19.01-0ubuntu1 all Shared files used by the NVIDIA libraries
iU libnvidia-common-520 520.61.05-0ubuntu1 all Shared files used by the NVIDIA libraries
rc libnvidia-compute-465:amd64 465.19.01-0ubuntu1 amd64 NVIDIA libcompute package
iU libnvidia-compute-520:amd64 520.61.05-0ubuntu1 amd64 NVIDIA libcompute package
iU libnvidia-compute-520:i386 520.61.05-0ubuntu1 i386 NVIDIA libcompute package
ii libnvidia-container-tools 1.11.0-1 amd64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:amd64 1.11.0-1 amd64 NVIDIA container runtime library
iU libnvidia-decode-520:amd64 520.61.05-0ubuntu1 amd64 NVIDIA Video Decoding runtime libraries
iU libnvidia-decode-520:i386 520.61.05-0ubuntu1 i386 NVIDIA Video Decoding runtime libraries
iU libnvidia-encode-520:amd64 520.61.05-0ubuntu1 amd64 NVENC Video Encoding runtime library
iU libnvidia-encode-520:i386 520.61.05-0ubuntu1 i386 NVENC Video Encoding runtime library
iU libnvidia-extra-520:amd64 520.61.05-0ubuntu1 amd64 Extra libraries for the NVIDIA driver
iU libnvidia-fbc1-520:amd64 520.61.05-0ubuntu1 amd64 NVIDIA OpenGL-based Framebuffer Capture runtime library
iU libnvidia-fbc1-520:i386 520.61.05-0ubuntu1 i386 NVIDIA OpenGL-based Framebuffer Capture runtime library
iU libnvidia-gl-520:amd64 520.61.05-0ubuntu1 amd64 NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
iU libnvidia-gl-520:i386 520.61.05-0ubuntu1 i386 NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
rc nvidia-compute-utils-465 465.19.01-0ubuntu1 amd64 NVIDIA compute utilities
iU nvidia-compute-utils-520 520.61.05-0ubuntu1 amd64 NVIDIA compute utilities
ii nvidia-container-toolkit 1.11.0-1 amd64 NVIDIA Container toolkit
ii nvidia-container-toolkit-base 1.11.0-1 amd64 NVIDIA Container Toolkit Base
rc nvidia-dkms-465 465.19.01-0ubuntu1 amd64 NVIDIA DKMS package
iU nvidia-dkms-520 520.61.05-0ubuntu1 amd64 NVIDIA DKMS package
iU nvidia-driver-520 520.61.05-0ubuntu1 amd64 NVIDIA driver metapackage
rc nvidia-kernel-common-465 465.19.01-0ubuntu1 amd64 Shared files used with the kernel module
iU nvidia-kernel-common-520 520.61.05-0ubuntu1 amd64 Shared files used with the kernel module
iU nvidia-kernel-source-520 520.61.05-0ubuntu1 amd64 NVIDIA kernel source package
iU nvidia-modprobe 520.61.05-0ubuntu1 amd64 Load the NVIDIA kernel driver and create device files
ii nvidia-opencl-dev:amd64 9.1.85-3ubuntu1 amd64 NVIDIA OpenCL development files
ii nvidia-prime 0.8.16~0.18.04.1 all Tools to enable NVIDIA’s Prime
iU nvidia-settings 520.61.05-0ubuntu1 amd64 Tool for configuring the NVIDIA graphics driver
iU nvidia-utils-520 520.61.05-0ubuntu1 amd64 NVIDIA driver support binaries
iU xserver-xorg-video-nvidia-520 520.61.05-0ubuntu1 amd64 NVIDIA binary Xorg driver





  ls -l /usr/lib/x86_64-linux-gnu/libcuda*
    
        lrwxrwxrwx 1 root root 28 Sep 29 05:22 /usr/lib/x86_64-linux-gnu/libcudadebugger.so.1 → libcudadebugger.so.520.61.05
        -rw-r–r-- 1 root root 10934360 Sep 29 01:20 /usr/lib/x86_64-linux-gnu/libcudadebugger.so.520.61.05
        lrwxrwxrwx 1 root root 12 Sep 29 05:22 /usr/lib/x86_64-linux-gnu/libcuda.so → libcuda.so.1
        lrwxrwxrwx 1 root root 20 Sep 29 05:22 /usr/lib/x86_64-linux-gnu/libcuda.so.1 → libcuda.so.520.61.05
        -rw-r–r-- 1 root root 26284256 Sep 29 01:56 /usr/lib/x86_64-linux-gnu/libcuda.so.520.61.05


dkms status

virtualbox, 5.2.42, 5.4.0-126-generic, x86_64: installed
virtualbox, 5.2.42, 5.4.0-72-generic, x86_64: installed

답변1

현재 드라이버로 인해 검은색 화면이 발생하고 시작 시 컴퓨터가 정지되는 것 같습니다.

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 520.61.05    Driver Version: 520.61.05    CUDA Version: 11.8     |
|-------------------------------+----------------------+----------------------+

22.04드라이버/cuda 패키지를 업그레이드한 후 베어 메탈 Ubuntu에서 이 문제가 발생했습니다. 그러나 rtx3090과 같은 패스스루 GPU가 있는 가상 머신은 동일한 드라이버 및 OS 버전에서 제대로 작동합니다. 아마도 GPU를 계산에만 사용하고 표시에는 사용하지 않기 때문일 수 있습니다.

어떤 사람들은 HDMI 입력을 DP로 전환하는 것이 도움이 될 수 있다고 말합니다. 나는 그것을 테스트하지 않았습니다. Nvidia 관계자에 따르면 다음 버전에서 수정 사항이 공개될 예정이므로 이전 버전으로 다운그레이드하거나 수정을 기다리면 됩니다.

https://forums.developer.nvidia.com/t/nvidia-driver-520-61-05-cuda-11-8-rtx-3090-black-display-and-superslow-modesets/230217/5

관련 정보