데비안 9의 CUDA - 툴킷은 어디에 있나요?

데비안 9의 CUDA - 툴킷은 어디에 있나요?

Debian 9에 CUDA를 설치하는 방법에 대한 몇 가지 튜토리얼을 따랐습니다.

nvcc지금까지 제가 사용해 본 것 중 가장 좋은 것은이 링크.

이제 문제는 툴킷을 찾을 수 없다는 것입니다. 명령 등을 사용해 보았지만 find아무것도 없습니다. 혹시 툴킷이 어디에 있는지 아는 사람 있나요?

왜냐하면 nvccCUDA를 사용하여 간단한 "Hello World" 프로그램을 실행하고 컴파일할 때마다 라이브러리를 찾을 수 없기 때문에 오류가 발생하기 때문입니다. 예제를 설치하려고 하면 툴킷 경로를 묻는 메시지가 표시되지만 찾을 수 없습니다.

다음에 추가:

다음을 사용하여 모든 것을 설치했습니다.

apt-get install nvidia-cuda-dev nvidia-cuda-toolkit  nvidia-driver 

그 후 나는 다음을 실행했습니다.

nvcc -V

nvcc가 설치되어 있는지 확인하기 위한 출력은 다음과 같습니다.

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016

우분투 16.04 및 CUDA 8.0용 .run 파일을 다운로드했습니다.

cuda_8.0.61_375.26_linux-run

드라이버 설치와 툴킷 설치를 건너뛰고 예제 설치로 바로 이동합니다.

Do you accept the previously read EULA?
accept/decline/quit: accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /root ]: /home/sergiobranco/cuda_samples

Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: 

Error: cannot find Toolkit in /usr/local/cuda-8.0
Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: ??????????

문제는 툴킷 위치를 묻는데 내가 모른다는 것입니다. Enter 키를 누른 다음 예제를 설치하려고 하는데 오류가 발생합니다.

Error: unsupported compiler: 6.3.0. Use --override to override this check.
Missing recommended library: libXmu.so

Error: cannot find Toolkit in /usr/local/cuda-8.0

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installation Failed. Using unsupported Compiler.
Samples:  Cannot find Toolkit in /usr/local/cuda-8.0


Logfile is /tmp/cuda_install_3212.log

--override 매개변수를 사용했지만 실패했습니다.

그 후 나는 cuda가 제공한 "첫 번째 프로그램" 중 적어도 하나를 컴파일하려고 했습니다.

#include <stdio.h>

__global__
void saxpy(int n, float a, float *x, float *y)
{
  int i = blockIdx.x*blockDim.x + threadIdx.x;
  if (i < n) y[i] = a*x[i] + y[i];
}

int main(void)
{
  int N = 1<<20;
  float *x, *y, *d_x, *d_y;
  x = (float*)malloc(N*sizeof(float));
  y = (float*)malloc(N*sizeof(float));

  cudaMalloc(&d_x, N*sizeof(float)); 
  cudaMalloc(&d_y, N*sizeof(float));

  for (int i = 0; i < N; i++) {
    x[i] = 1.0f;
    y[i] = 2.0f;
  }

  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
  cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);

  // Perform SAXPY on 1M elements
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);

  cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);

  float maxError = 0.0f;
  for (int i = 0; i < N; i++)
    maxError = max(maxError, abs(y[i]-4.0f));
  printf("Max error: %f\n", maxError);

  cudaFree(d_x);
  cudaFree(d_y);
  free(x);
  free(y);
}

그러나 결과는 다음과 같습니다.

nvcc -ccbin clang-3.8 hello.c 
nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).
hello.c:3:1: error: unknown type name '__global__'
__global__
^
hello.c:4:1: error: expected identifier or '('
void saxpy(int n, float a, float *x, float *y)
^
hello.c:14:15: warning: implicitly declaring library function 'malloc' with type 'void *(unsigned long)' [-Wimplicit-function-declaration]
  x = (float*)malloc(N*sizeof(float));
              ^
hello.c:14:15: note: include the header <stdlib.h> or explicitly provide a declaration for 'malloc'
hello.c:17:3: warning: implicit declaration of function 'cudaMalloc' is invalid in C99 [-Wimplicit-function-declaration]
  cudaMalloc(&d_x, N*sizeof(float)); 
  ^
hello.c:25:3: warning: implicit declaration of function 'cudaMemcpy' is invalid in C99 [-Wimplicit-function-declaration]
  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
  ^
hello.c:25:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
                                      ^
hello.c:26:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
  cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);
                                      ^
hello.c:29:3: error: use of undeclared identifier 'saxpy'
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
  ^
hello.c:29:10: error: expected expression
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
         ^
hello.c:29:29: error: expected expression
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                            ^
hello.c:29:31: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                              ^
hello.c:29:34: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                                 ^~~~
hello.c:29:40: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                                       ^~~
hello.c:31:39: error: use of undeclared identifier 'cudaMemcpyDeviceToHost'
  cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);
                                      ^
hello.c:35:16: warning: implicit declaration of function 'max' is invalid in C99 [-Wimplicit-function-declaration]
    maxError = max(maxError, abs(y[i]-4.0f));
               ^
hello.c:35:30: warning: implicitly declaring library function 'abs' with type 'int (int)' [-Wimplicit-function-declaration]
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^
hello.c:35:30: note: include the header <stdlib.h> or explicitly provide a declaration for 'abs'
hello.c:35:30: warning: using integer absolute value function 'abs' when argument is of floating point type [-Wabsolute-value]
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^
hello.c:35:30: note: use function 'fabsf' instead
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^~~
                             fabsf
hello.c:35:30: note: include the header <math.h> or explicitly provide a declaration for 'fabsf'
hello.c:38:3: warning: implicit declaration of function 'cudaFree' is invalid in C99 [-Wimplicit-function-declaration]
  cudaFree(d_x);
  ^
hello.c:40:3: warning: implicit declaration of function 'free' is invalid in C99 [-Wimplicit-function-declaration]
  free(x);
  ^
11 warnings and 8 errors generated.

답변1

글쎄, 마침내 모든 것을 설치할 수 있었고 잘 작동했습니다. 데비안 9에서 이 작업을 수행하는 방법에 대한 전체 튜토리얼을 여기에 게시하겠습니다:

첫 번째 단계:

apt-get install nvidia-cuda-dev nvidia-cuda-toolkit  nvidia-driver 

위 명령을 실행하려면 다음을 확인해야 합니다.이 링크마더보드에 대해 이 작업을 올바르게 수행하는 방법을 더 잘 이해하려면

그런 다음 다음 실행 파일을 다운로드했습니다.쿠다 8.0

또한 다음을 설치해야 했습니다:

apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev

그런 다음 툴킷이 작동하려면 $PATH에 툴킷을 포함해야 했습니다.

export PATH=$PATH:/usr/lib/nvidia-cuda-toolkit

그런 다음 다음을 수행해야 합니다.

sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run --tar mxvf
cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base/
export $PERL5LIB

이제 예제를 설치할 수 있습니다:

sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run

툴킷 경로를 묻는 경우 다음을 입력해야 합니다.

/usr/lib/nvidia-cuda-toolkit

내 대답은 다음과 같습니다.

Do you accept the previously read EULA?
accept/decline/quit: accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /root ]: /somewher

Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: /usr/lib/nvidia-cuda-toolkit

이제 문제 없이 예제를 설치할 수 있습니다. 그런 다음 설치된 폴더로 이동하여 실행할 수 있습니다.

nvcc -ccbin clang++-3.8 somefile.cu -o somename

그러면 그렇게 해. . .

pycuda를 설치하려면 다음을 수행하십시오.

apt-get install build-essential python-dev python-setuptools libboost-python-dev libboost-thread-dev -y
apt-get install python-pycuda

관련 정보