【深度学习】腾讯云服务器上搭建 mmdetection 目标检测框架

2022-05-27 11:18:49 浏览数 (2)

步入研究生后,为了发文章难免要接触深度学习,因此非常依赖 GPU 来跑实验,然而大部分实验室不具备 GPU 服务器。这个时候腾讯云是个极佳的选择,在此我也记录一下我在腾讯云 GPU 服务器上配置目标检测框架时的一些心得体会,帮助之后的小伙伴少走弯路。

Step1: 登录服务器

(1)安装 Xshell

家庭 / 学校免费申请:链接

下载链接会发送到你填写的邮箱,打开链接直接安装即可,这里忽略安装流程。

(2)配置使用 Xshell 连接云服务器

打开 Xshell,在弹出窗口中单击新建。

然后根据控制台中实例的公网地址,配置连接,如下图。(端口号默认为22)

主机及端口号配置主机及端口号配置

接下来,查看站内信中提供的账号和密码,配置登录身份验证,如下图。

用户名和密码用户名和密码

单击连接,如果输入无误,即可完成服务器登录。

Step2: 安装NVIDIA驱动

(1)首先禁用 nouveau

代码语言:javascript复制
sudo vim /etc/modprobe.d/blacklist.conf

(2)在文件末添加(按 i 插入本文,按 :wq 保存并退出)

代码语言:javascript复制
blacklist nouveau
options nouveau modeset=0

(3)加入 ppa仓库

代码语言:javascript复制
sudo apt-get remove --purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

(4)查看推荐的驱动版本(可选)

代码语言:javascript复制
sudo apt install ubuntu-drivers-common
ubuntu-drivers devices
推荐的驱动版本(P40 和 T4均推荐 470 版本)推荐的驱动版本(P40 和 T4均推荐 470 版本)

(5)安装驱动

代码语言:javascript复制
sudo apt-get install nvidia-driver-470  # 根据上面查到的版本自行更改
sudo apt-get install mesa-common-dev
sudo apt-get update
sudo apt-get upgrade

(6)验证安装是否成功(记得重启)

代码语言:javascript复制
nvidia-smi
nvidia-sminvidia-smi

Step3: 安装cuda toolkit和cudnn

(1)选择 CUDA Toolkit 版本

注意这一步中安装的 cuda toolkit 和 cudnn 版本必须要与上面安装的显卡驱动版本一致。

例如上面我安装的 CUDA Version 是 11.4,那么就要安装相应版本的 CUDA Toolkit。

在 https://developer.nvidia.com/cuda-toolkit-archive 中选择对应的工具包版本。

(PS:如果有倒霉蛋和我一样安装错了,安装之后报了Failed to initialize NVML Driver,可以参考这个 链接)

(2)安装 CUDA Toolkit

接下来,根据你的系统选择对应的版本。

选择操作系统选择操作系统

根据下面的安装命令逐一输入,即可完成安装。

Toolkit 安装命令Toolkit 安装命令

Step4: 命令行安装anaconda

(1) 查看最新版本的anaconda

最新版本 anaconda 镜像地址

选择你需要的版本,然后右键复制链接地址

(2)下载anaconda

记得把下面的链接地址改成你刚刚复制的。

代码语言:javascript复制
wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh 

(3)bash 命令安装anaconda

记得把文件名改成你下载的文件,然后一路回车和yes就可以。

代码语言:javascript复制
bash Anaconda3-2022.05-Linux-x86_64.sh -p anaconda/ -u

(4)验证安装(注意修改为自己的用户名)

代码语言:javascript复制
 echo 'export PATH="/home/你的用户名/anaconda/bin:$PATH"' >> ~/.bashrc
 source ~/.bashrc
 conda --version
验证 anaconda验证 anaconda

(5)更新pip(非必须)

代码语言:javascript复制
python -m pip install -U pip 

Step5: 安装mmdetection

(1)创建conda 虚拟环境并激活

代码语言:javascript复制
 conda create -n openmmlab python=3.7 -y
 conda activate openmmlab

(2)安装 Pytorch(可参考Pytorch官网安装)

Pytorch官网

代码语言:javascript复制
 pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

(3)使用 openmim 安装 mmdetection

代码语言:javascript复制
pip install openmim
mim install mmdet

至此,腾讯云服务器的 GPU 驱动和目标检测框架 mmdetection 就配置完成了。

0 人点赞