查看GPU型号:
代码语言:javascript复制lspci | grep -i nvidia
驱动安装:
https://www.nvidia.cn/Download/index.aspx?lang=cn
下载对应版本的驱动驱动程序;
安装 gcc, g , make 最新版本程序;
安装 ubuntu 32 位兼容库;
运行 .run 文件进行安装;阅读其中提示的信息并进行安装,注意 网上有的博客提示暂时不要安装 opengl,但是其中有坑,我刚开始不安装opengl 的时候opengl 相关的功能不能使用;最后还是重新进行安装了;
./nvidiainstaller.run (--no-opengl-files :此选项根据具体环境可选,建议不添加此选项进行完整安装,如果你只使用 显卡做机器学习可以添加上此选项不安装opengl)
重新启动后,查看 nvidia-settings 是否能够运行,并检查运行信息;
cuda 安装:
下载cuda最新文件:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal
注意对应版本来安装;
./cuda-installer.run
安装过后,记得添加环境变量:
vi ~/.bashrc
在文件末尾添加
export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH"
最后使其生效
source ~/.bashrc
安装驱动和cuda后,执行测试例程,检测环境是否安装成功:
/usr/local/cuda-10.1/samples/1_Utilities/deviceQuery cuda sample 中,进行使用 make编译并运行。执行结束后,显示通过表示cuda安装成功;
详细安装教程,请参考网友文章:https://www.cnblogs.com/zmbreathing/p/CUDA.html ,我已经进行验证,安装过程没问题;
显卡驱动卸载:
./NVIDIA-Linux-x86_64-435.21.run --uninstall
可等待机器重启过后,重新进行安装显卡驱动;
保持更新,如果对您有帮助,请关注 cnblogs.com/xuyaowen,获得更多信息;
# 查看GPU 拓扑:2019年11月10日
代码语言:javascript复制nvidia-smi topo --matrix
代码语言:javascript复制 GPU0 CPU Affinity
GPU0 X 0-13,28-41
Legend:
X = Self
SYS = Connection traversing PCIe as well as the SMP interconnect between NUMA nodes (e.g., QPI/UPI)
NODE = Connection traversing PCIe as well as the interconnect between PCIe Host Bridges within a NUMA node
PHB = Connection traversing PCIe as well as a PCIe Host Bridge (typically the CPU)
PXB = Connection traversing multiple PCIe switches (without traversing the PCIe Host Bridge)
PIX = Connection traversing a single PCIe switch
NV# = Connection traversing a bonded set of # NVLinks
GPU NCCL Multi-GPU多卡通信框架相关:
https://cloud.tencent.com/developer/article/1766933
nvidia 命令使用:
https://cloud.tencent.com/developer/article/1767005