背景
Grounded-Segment-Anything是一个通过结合Grounding DINO和Segment Anything 来创建一个非常有趣的Demo,旨在检测和分割任何带有文本输入的东西!
由于它需要运行在英伟达的GPU上,对于CUDA和PyTorch也有要求。而配置这样的环境,有时候没有那么容易。比如使用坑爹的CUDA Version:12.x。本文旨在基于腾讯云云服务器CVM来构建一套保证Grounded-Segment-Anything中demo可运行的环境。
购买腾讯云云服务器CVM
详见《基于腾讯云云服务器CVM ubuntu操作系统安装Docker-CE》中 服务器购买 部分。
Docker环境搭建
代码语言:txt复制docker run --rm --gpus all nvidia/cuda:11.8.0-base-ubuntu20.04 nvidia-smi
代码语言:txt复制docker run --gpus all -it nvidia/cuda:11.8.0-cudnn8-devel-ubuntu22.04
进入镜像后,执行如下命令:
代码语言:txt复制cd ~
apt-get update
apt update
apt-get install git
apt-get install python3
apt-get install pip
apt-get install wget
apt-get install -y libgl1-mesa-glx
apt-get install libglib2.0-0
git clone https://github.com/chenxwh/Grounded-Segment-Anything.git
cd ~/Grounded-Segment-Anything/
pip install -r requirements.txt
cd ~/Grounded-Segment-Anything/segment_anything/
pip install .
cd ~/Grounded-Segment-Anything/GroundingDINO/
pip install .
cd ~/Grounded-Segment-Anything/
wget https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth
python3 grounding_dino_demo.py