서버에서 cuda랑 cudnn을 바꿔야 한다.
nvidia-driver도 지원하는지 확ㅇ니해보자.
기본적으로 이 링크를 따라했다.
https://jdselectron.tistory.com/85
cd /usr/local 확인해보면 원하는 cuda 버전이 깔려있다.
# displaymanager 비활성화, 정확히 뭔지 모름
systemctl isolate multi-user.target
# nvidia 관련 사용하지 않는 거 전부 삭제
sudo apt --purge autoremove nvidia*
# cuda를 깔면 알아서 맞는 nvidia driver를 깔아준당
# 원래 뭐가 차라라랑하면서 이것들 지울 거다, 몇 메가 비운다, 동의? Y/N 나오면서 삭제되어야 하는데
# 그게 안 떴다. sudo nvidia-uninstall하니까 삭제됐다.
sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.105-418.39_1.0-1_amd64.deb
# 위에 명령어 치면 아래 명령어 비슷한 뭐가 나옴 그거 그대로 복붙하면 됨
sudo apt-key add /var/cuda-repo-10-1-local-10.1.105-418.39/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
sudo vi /etc/profile
# 수정할 부분, 10.0을 10.1로 수정
export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH"
source /etc/profile
# 수정 후 쿠다 버전이 10.1로 나오면 잘 바뀐 것
nvcc -V
# nvidia-smi 안 되면 reboot하고 다시 해볼 것!
nvidia-smi
tar xzvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
which nvcc
sudo cp cuda/lib64/* /usr/local/cuda-10.1/lib64/
sudo cp cuda/include/* /usr/local/cuda-10.1/include/
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h
# 확인해보기, 에러가 안 나오고 버전 나오면 잘 된 거
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2