步入研究生后,为了发文章难免要接触深度学习,因此非常依赖 GPU 来跑实验,然而大部分实验室不具备 GPU 服务器。这个时候腾讯云是个极佳的选择,在此我也记录一下我在腾讯云 GPU 服务器上配置目标检测框架时的一些心得体会,帮助之后的小伙伴少走弯路。
Step1: 登录服务器
(1)安装 Xshell
家庭 / 学校免费申请:链接
下载链接会发送到你填写的邮箱,打开链接直接安装即可,这里忽略安装流程。
(2)配置使用 Xshell 连接云服务器
打开 Xshell,在弹出窗口中单击新建。
然后根据控制台中实例的公网地址,配置连接,如下图。(端口号默认为22)
接下来,查看站内信中提供的账号和密码,配置登录身份验证,如下图。
单击连接,如果输入无误,即可完成服务器登录。
Step2: 安装NVIDIA驱动
(1)首先禁用 nouveau
代码语言:javascript复制sudo vim /etc/modprobe.d/blacklist.conf
(2)在文件末添加(按 i 插入本文,按 :wq 保存并退出)
代码语言:javascript复制blacklist nouveau
options nouveau modeset=0
(3)加入 ppa仓库
代码语言:javascript复制sudo apt-get remove --purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
(4)查看推荐的驱动版本(可选)
代码语言:javascript复制sudo apt install ubuntu-drivers-common
ubuntu-drivers devices
(5)安装驱动
代码语言:javascript复制sudo apt-get install nvidia-driver-470 # 根据上面查到的版本自行更改
sudo apt-get install mesa-common-dev
sudo apt-get update
sudo apt-get upgrade
(6)验证安装是否成功(记得重启)
代码语言:javascript复制nvidia-smi
Step3: 安装cuda toolkit和cudnn
(1)选择 CUDA Toolkit 版本
注意这一步中安装的 cuda toolkit 和 cudnn 版本必须要与上面安装的显卡驱动版本一致。
例如上面我安装的 CUDA Version 是 11.4,那么就要安装相应版本的 CUDA Toolkit。
在 https://developer.nvidia.com/cuda-toolkit-archive 中选择对应的工具包版本。
(PS:如果有倒霉蛋和我一样安装错了,安装之后报了Failed to initialize NVML Driver,可以参考这个 链接)
(2)安装 CUDA Toolkit
接下来,根据你的系统选择对应的版本。
根据下面的安装命令逐一输入,即可完成安装。
Step4: 命令行安装anaconda
(1) 查看最新版本的anaconda
最新版本 anaconda 镜像地址
选择你需要的版本,然后右键复制链接地址
(2)下载anaconda
记得把下面的链接地址改成你刚刚复制的。
代码语言:javascript复制wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh
(3)bash 命令安装anaconda
记得把文件名改成你下载的文件,然后一路回车和yes就可以。
代码语言:javascript复制bash Anaconda3-2022.05-Linux-x86_64.sh -p anaconda/ -u
(4)验证安装(注意修改为自己的用户名)
代码语言:javascript复制 echo 'export PATH="/home/你的用户名/anaconda/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc
conda --version
(5)更新pip(非必须)
代码语言:javascript复制python -m pip install -U pip
Step5: 安装mmdetection
(1)创建conda 虚拟环境并激活
代码语言:javascript复制 conda create -n openmmlab python=3.7 -y
conda activate openmmlab
(2)安装 Pytorch(可参考Pytorch官网安装)
Pytorch官网
代码语言:javascript复制 pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
(3)使用 openmim 安装 mmdetection
代码语言:javascript复制pip install openmim
mim install mmdet
至此,腾讯云服务器的 GPU 驱动和目标检测框架 mmdetection 就配置完成了。