使用GPU云服务器搭建深度学习环境(CUDA+CUDNN)

2022-04-12 20:39:00 浏览数 (2)

使用环境:腾讯云官方镜像centos8.2

一、安装显卡驱动

1.配置基础环境

1.1、禁用nouveau

nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和CUDA之前应先禁用nouveau。

查看系统是否正在使用nouveau

代码语言:javascript复制
lsmod | grep nouveau

如果有显示内容,则进行以下的步骤进行禁用nouveau

新建一个配置文件

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在该配置文件中输入i,写入以下内容

代码语言:javascript复制
 blacklist nouveau 
 options nouveau modeset=0 

保存并退出

:wq!

备份当前的镜像

sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

建立新的镜像

sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启

sudo reboot

最后验证,没有任何显示即为禁用成功

lsmod | grep nouveau

2.安装依赖

输入以下命令安装GCC与G

yum install gcc

yum install gcc-c

输入以下命令安装kernel-devel和kernel-headers:

yum install kernel-devel

yum install kernel-headers

3.安装显卡驱动

使用如下命令查看显卡的类型

lspci | grep -i nvidia

root@VM-0-10-centos ~]# lspci | grep -i nvidia

00:08.0 3D controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)

这里可以看到我的显卡是Tesla T4 我们需要前往英伟达官网查看所支持该显卡的驱动版本

Official Drivers | NVIDIA

下载驱动文件 并上传到服务器中

cd跳转到驱动所在的目录下,并给予执行权限

chmod u x NVIDIA-Linux-x86_64-450.172.01.run

完成后执行安装脚本

代码语言:javascript复制
sudo ./NVIDIA-Linux-x86_64-450.172.01.run --kernel-source-path=/usr/src/kernels/4.18.0-348.7.1.el8_5.x86_64

代码语言:javascript复制
输入 nvidia-smi 

如果看到以下输出则代表安装成功

二、安装CUDA

在英伟达官网下载对应版本的CUDA CUDA Toolkit 11.0 Download | NVIDIA Developer

进行如图所示选择 并且复制到服务器内运行

下载完成之后记得赋予文件777权限

代码语言:javascript复制
执行 sudo sh cuda_11.0.2_450.51.05_linux.run

2、配置环境变量

vim /etc/profile

代码语言:javascript复制
第一次发布
export PATH=/usr/local/cuda-11.0/bin${PATH: :${PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-.0/lib64${LD_LIBRARY_PATH: :${LD_LIBRARY_PATH}}
第二次发布
export PATH=/usr/local/cuda/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

source /etc/profile

完成之后记得重启

3、验证CUDA是否安装成功

输入nvcc -V

如果看到以下输出 则代表安装成功

三、安装CUDNN

在官网下载对应版本的cudnnNVIDIA cuDNN | NVIDIA Developer

将其通过FTP传送到服务器内 并进行解压

cudnn-11.0-linux-x64-v8.0.3.33.tgz

完成解压后将会得到一个CUDA文件夹

将里面的lib64与include复制到您之前安装CUDA的目录中去

之后输入

代码语言:javascript复制
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

如看到以下输出 则代表安装成功

0 人点赞