Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)

2021-04-07 10:59:01 浏览数 (1)

修正:Ubuntu 18.04 RTX2080Ti建议安装cuda10.0,cudnn7.5.1,pytorch1.4.0 cu100 / torchvision0.5.0 cu100,tensorflow-gpu1.14.0 修正日期:20200611

安装方式与下文描述类似,只要选择上面的版本安装即可


一、安装cuda(准备工作

1、检查Linux版本是否支持CUDA Ubuntu18.04 RTX2080ti 支持

2、检查系统是否安装gcc

代码语言:javascript复制
gcc --version

3、 检查是否安装了kernel header和 package development

在终端中输入: uname -r 可以查看自己的kernel版本信息 在终端中输入: sudo apt-get install linux-headers-$(uname -r) 可以安装对应kernel版本的kernel headerpackage development

4、运行nvidia-smi 查看现有驱动支持的cuda版本

(重要)根据上述运行结果查看driver version和CUDA Version的版本。此外,如果需要安装pytorch或者tensorflow,可登陆pytorch官网进行查看当前pytorch支持的cuda的版本,根据对应的版本下载pytorch。

5、下载官网run文件:cuda官网

下载完成后

6、runfile安装 A) 禁用 nouveau 终端中运行: lsmod | grep nouveau,如果有输出则代表nouveau正在加载。 因为我早就安装了NVIDIA的显卡驱动,禁用了nouveau,所以没有输出。

B) 切换到.run安装文件的路径,运行 sudo sh cuda_10.1.105_418.39_linux.run (10.2版本类似)!

注意:不安装driver,否则重启之后电脑一直蓝屏(踩坑)。

7、设置环境变量

终端输入:sudo gedit /etc/profile,输密码后进入,打开文件末尾,加入以下两行后保存。(10.2版本类似)

代码语言:javascript复制
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda10.1/lib64 

1)在终端输入sudo gedit ~/.bashrc

2)在文本的最后输入

代码语言:javascript复制
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1

目录要对应自己的cuda版本 3)然后source ~/.bashrc 激活环境 4)在终端输入nvcc -V出现下面画面则安装成功 !blog.csdnimg.cn/20200528154419611.png

(图片参考:https://blog.csdn.net/hou9021/article/details/104311088)


重启:sudo reboot 开始测试cuda是否安装成功: 命令如下:

代码语言:javascript复制
cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

最后结果显示,如下:

(图片参考:https://blog.51cto.com/14204744/2464180?source=dra)

有些地方可能会不一样,只要最后是Result = PASS就代表这cuda10.1安装成功了。


CUDA卸载:

代码语言:javascript复制
cd /usr/local/cuda/bin
sudo ./cuda-uninstaller

CUDNN安装

安装cuDNN 7.6.5版本,转到官网下载,下载前先注册一下,填个调查问卷,根据自己的环境和架构选择包,下载到本地

注意:具体的版本请参照官网,只需要与cuda的版本对应即可

切换到下载目录 cd Downloads ,然后按照以下操作进行,

解压: cuDNN Library for Linux, 输入: tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

将解压出来的文件复制到安装的CUDA环境中,输入:

代码语言:javascript复制
sudo cp cuda/include/cudnn.h /usr/local/cuda/inlude
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64  

更改权限,输入:

代码语言:javascript复制
sudo chmod a r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*  

注意:如果系统提示找不到cudnn.h,可复制cuda/include/cudnn.h/usr/local/cuda/include/目录下

安装PyTorch1.3

进入PyTorch官网安装合适的版本,官网 ,

输入: pip3 install torch torchvision ,等待安装结束(现在官网最新版本为1.5)

安装完成后,进入python3环境,验证是否成功,

输入: python3

再输入:

代码语言:javascript复制
import torch
import torchvision

没有报错,说明安装成功。

最后验证下GPU能否使用,输入: print(torch.cuda.is_available()) ,输出True,说明没问题。


参考文章:https://www.cnblogs.com/booturbo/archive/2019/11/11/11834661.html

发布者:全栈程序员栈长,转转请注明出处:https://javaforall.cn/2164.html原文链接:

0 人点赞