Debian 9에 CUDA를 설치하는 방법에 대한 몇 가지 튜토리얼을 따랐습니다.
nvcc
지금까지 제가 사용해 본 것 중 가장 좋은 것은이 링크.
이제 문제는 툴킷을 찾을 수 없다는 것입니다. 명령 등을 사용해 보았지만 find
아무것도 없습니다. 혹시 툴킷이 어디에 있는지 아는 사람 있나요?
왜냐하면 nvcc
CUDA를 사용하여 간단한 "Hello World" 프로그램을 실행하고 컴파일할 때마다 라이브러리를 찾을 수 없기 때문에 오류가 발생하기 때문입니다. 예제를 설치하려고 하면 툴킷 경로를 묻는 메시지가 표시되지만 찾을 수 없습니다.
다음에 추가:
다음을 사용하여 모든 것을 설치했습니다.
apt-get install nvidia-cuda-dev nvidia-cuda-toolkit nvidia-driver
그 후 나는 다음을 실행했습니다.
nvcc -V
nvcc가 설치되어 있는지 확인하기 위한 출력은 다음과 같습니다.
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016
우분투 16.04 및 CUDA 8.0용 .run 파일을 다운로드했습니다.
cuda_8.0.61_375.26_linux-run
드라이버 설치와 툴킷 설치를 건너뛰고 예제 설치로 바로 이동합니다.
Do you accept the previously read EULA?
accept/decline/quit: accept
You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /root ]: /home/sergiobranco/cuda_samples
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:
Error: cannot find Toolkit in /usr/local/cuda-8.0
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]: ??????????
문제는 툴킷 위치를 묻는데 내가 모른다는 것입니다. Enter 키를 누른 다음 예제를 설치하려고 하는데 오류가 발생합니다.
Error: unsupported compiler: 6.3.0. Use --override to override this check.
Missing recommended library: libXmu.so
Error: cannot find Toolkit in /usr/local/cuda-8.0
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installation Failed. Using unsupported Compiler.
Samples: Cannot find Toolkit in /usr/local/cuda-8.0
Logfile is /tmp/cuda_install_3212.log
--override 매개변수를 사용했지만 실패했습니다.
그 후 나는 cuda가 제공한 "첫 번째 프로그램" 중 적어도 하나를 컴파일하려고 했습니다.
#include <stdio.h>
__global__
void saxpy(int n, float a, float *x, float *y)
{
int i = blockIdx.x*blockDim.x + threadIdx.x;
if (i < n) y[i] = a*x[i] + y[i];
}
int main(void)
{
int N = 1<<20;
float *x, *y, *d_x, *d_y;
x = (float*)malloc(N*sizeof(float));
y = (float*)malloc(N*sizeof(float));
cudaMalloc(&d_x, N*sizeof(float));
cudaMalloc(&d_y, N*sizeof(float));
for (int i = 0; i < N; i++) {
x[i] = 1.0f;
y[i] = 2.0f;
}
cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);
// Perform SAXPY on 1M elements
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);
float maxError = 0.0f;
for (int i = 0; i < N; i++)
maxError = max(maxError, abs(y[i]-4.0f));
printf("Max error: %f\n", maxError);
cudaFree(d_x);
cudaFree(d_y);
free(x);
free(y);
}
그러나 결과는 다음과 같습니다.
nvcc -ccbin clang-3.8 hello.c
nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).
hello.c:3:1: error: unknown type name '__global__'
__global__
^
hello.c:4:1: error: expected identifier or '('
void saxpy(int n, float a, float *x, float *y)
^
hello.c:14:15: warning: implicitly declaring library function 'malloc' with type 'void *(unsigned long)' [-Wimplicit-function-declaration]
x = (float*)malloc(N*sizeof(float));
^
hello.c:14:15: note: include the header <stdlib.h> or explicitly provide a declaration for 'malloc'
hello.c:17:3: warning: implicit declaration of function 'cudaMalloc' is invalid in C99 [-Wimplicit-function-declaration]
cudaMalloc(&d_x, N*sizeof(float));
^
hello.c:25:3: warning: implicit declaration of function 'cudaMemcpy' is invalid in C99 [-Wimplicit-function-declaration]
cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
^
hello.c:25:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
^
hello.c:26:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);
^
hello.c:29:3: error: use of undeclared identifier 'saxpy'
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^
hello.c:29:10: error: expected expression
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^
hello.c:29:29: error: expected expression
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^
hello.c:29:31: warning: expression result unused [-Wunused-value]
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^
hello.c:29:34: warning: expression result unused [-Wunused-value]
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^~~~
hello.c:29:40: warning: expression result unused [-Wunused-value]
saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
^~~
hello.c:31:39: error: use of undeclared identifier 'cudaMemcpyDeviceToHost'
cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);
^
hello.c:35:16: warning: implicit declaration of function 'max' is invalid in C99 [-Wimplicit-function-declaration]
maxError = max(maxError, abs(y[i]-4.0f));
^
hello.c:35:30: warning: implicitly declaring library function 'abs' with type 'int (int)' [-Wimplicit-function-declaration]
maxError = max(maxError, abs(y[i]-4.0f));
^
hello.c:35:30: note: include the header <stdlib.h> or explicitly provide a declaration for 'abs'
hello.c:35:30: warning: using integer absolute value function 'abs' when argument is of floating point type [-Wabsolute-value]
maxError = max(maxError, abs(y[i]-4.0f));
^
hello.c:35:30: note: use function 'fabsf' instead
maxError = max(maxError, abs(y[i]-4.0f));
^~~
fabsf
hello.c:35:30: note: include the header <math.h> or explicitly provide a declaration for 'fabsf'
hello.c:38:3: warning: implicit declaration of function 'cudaFree' is invalid in C99 [-Wimplicit-function-declaration]
cudaFree(d_x);
^
hello.c:40:3: warning: implicit declaration of function 'free' is invalid in C99 [-Wimplicit-function-declaration]
free(x);
^
11 warnings and 8 errors generated.
답변1
글쎄, 마침내 모든 것을 설치할 수 있었고 잘 작동했습니다. 데비안 9에서 이 작업을 수행하는 방법에 대한 전체 튜토리얼을 여기에 게시하겠습니다:
첫 번째 단계:
apt-get install nvidia-cuda-dev nvidia-cuda-toolkit nvidia-driver
위 명령을 실행하려면 다음을 확인해야 합니다.이 링크마더보드에 대해 이 작업을 올바르게 수행하는 방법을 더 잘 이해하려면
그런 다음 다음 실행 파일을 다운로드했습니다.쿠다 8.0
또한 다음을 설치해야 했습니다:
apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev
그런 다음 툴킷이 작동하려면 $PATH에 툴킷을 포함해야 했습니다.
export PATH=$PATH:/usr/lib/nvidia-cuda-toolkit
그런 다음 다음을 수행해야 합니다.
sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run --tar mxvf
cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base/
export $PERL5LIB
이제 예제를 설치할 수 있습니다:
sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run
툴킷 경로를 묻는 경우 다음을 입력해야 합니다.
/usr/lib/nvidia-cuda-toolkit
내 대답은 다음과 같습니다.
Do you accept the previously read EULA?
accept/decline/quit: accept
You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /root ]: /somewher
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]: /usr/lib/nvidia-cuda-toolkit
이제 문제 없이 예제를 설치할 수 있습니다. 그런 다음 설치된 폴더로 이동하여 실행할 수 있습니다.
nvcc -ccbin clang++-3.8 somefile.cu -o somename
그러면 그렇게 해. . .
pycuda를 설치하려면 다음을 수행하십시오.
apt-get install build-essential python-dev python-setuptools libboost-python-dev libboost-thread-dev -y
apt-get install python-pycuda