서버에서 cuda랑 cudnn을 바꿔야 한다.

nvidia-driver도 지원하는지 확ㅇ니해보자.

기본적으로 이 링크를 따라했다.

https://jdselectron.tistory.com/85

cd /usr/local 확인해보면 원하는 cuda 버전이 깔려있다.

  1. nvidia 관련 다 삭제

# displaymanager 비활성화, 정확히 뭔지 모름
systemctl isolate multi-user.target 
# nvidia 관련 사용하지 않는 거 전부 삭제

sudo apt --purge autoremove nvidia* 
# cuda를 깔면 알아서 맞는 nvidia driver를 깔아준당

# 원래 뭐가 차라라랑하면서 이것들 지울 거다, 몇 메가 비운다, 동의? Y/N 나오면서 삭제되어야 하는데
# 그게 안 떴다. sudo nvidia-uninstall하니까 삭제됐다.
  1. CUDA 깔기
sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.105-418.39_1.0-1_amd64.deb

# 위에 명령어 치면 아래 명령어 비슷한 뭐가 나옴 그거 그대로 복붙하면 됨
sudo apt-key add /var/cuda-repo-10-1-local-10.1.105-418.39/7fa2af80.pub

sudo apt-get update

sudo apt-get -y install cuda
  1. PATH 설정하기
sudo vi /etc/profile
# 수정할 부분, 10.0을 10.1로 수정
export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH"

source /etc/profile
# 수정 후 쿠다 버전이 10.1로 나오면 잘 바뀐 것 
nvcc -V

# nvidia-smi 안 되면 reboot하고 다시 해볼 것!
nvidia-smi
  1. CUDNN 깔기
tar xzvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
which nvcc
sudo cp cuda/lib64/* /usr/local/cuda-10.1/lib64/
sudo cp cuda/include/* /usr/local/cuda-10.1/include/
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h

# 확인해보기, 에러가 안 나오고 버전 나오면 잘 된 거
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2