1.查看显卡支持的CUDA版本
查看版本
Release Notes :: CUDA Toolkit Documentation (nvidia.com)
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
根据数值选择相应cuda版本
2.安装CUDA
官网
从NVIDIA官方网站上下载适合你系统的CUDA Toolkit安装包。
CUDA Toolkit Archive | NVIDIA Developer
https://developer.nvidia.com/cuda-toolkit-archive
10.1版本可全装其他盘,11.7版本会有2个多G固定装在C盘
10.1版本
1. 下载地址
CUDA Toolkit 10.1 original Archive | NVIDIA Developer
https://developer.nvidia.com/cuda-10.1-download-archive-base?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
2. 安装过程
根据CUDA Toolkit的安装向导,选择适合你的选项进行安装,可以根据你的需求进行自定义安装。
- 双击.exe进行安装
- 临时文件,安装后自动清除
默认C盘,建议更改到D盘如图所示目录,便于后续添加环境变量
3. 将CUDA的路径添加到环境变量中
安装完成,需要将CUDA的路径添加到你的系统环境变量中。在Windows操作系统上,可以通过右键点击"计算机"(或"此电脑")-> 属性 -> 高级系统设置 -> 环境变量,在系统变量中找到"Path"变量并添加CUDA的安装路径。
新建如下环境变量,自己根据实际情况进行修改
代码语言:javascript复制D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1libx64
D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1include
D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1extrasCUPTlib64
D:CUDANVIDIA CorporationCUDA Samplesv10.1binwin64
D:CUDANVIDIA CorporationCUDA Samplesv10.1commonlibx64
(可选择新建,亦可选择“浏览”找到相应文件夹)
11.7版本与10.1有区别的部分
11.7安装过程可参照前文,这里仅介绍有区别的部分
1. 安装位置
缺NVIDIA Corporation的(2个多G)固定装在C盘
2. 默认添加环境变量
不需要手动添加环境变量
检验安装
代码语言:javascript复制nvcc -V
代码语言:javascript复制set cuda
卸载CUDA
卸载框选的4个:
3.下载cuDNN
CUDA10.1版本 cuDNN7.6.5
- 官网下载(需要先注册)cuDNN Archive | NVIDIA Developer
https://developer.nvidia.com/rdp/cudnn-archive
下载后,解压,然后将bin、include、lib文件夹下的文件直接复制到CUDA安装目录中的对应位置。
CUDA11.7版本 cuDNN8.5.0
检验是否安装成功
代码语言:javascript复制bandwidthTest.exe
"bandwidthTest.exe"用于测试CUDA设备的内存带宽。运行此可执行文件将显示出设备的内存读取和写入带宽信息,以及带宽测试的结果。这对于评估设备的性能和了解其内存访问速度非常有用。
代码语言:javascript复制deviceQuery.exe
"deviceQuery.exe"用于查询CUDA设备的属性和功能。运行此可执行文件将显示出设备的名称、计算能力、CUDA核心数量、内存总量、内存时钟频率等信息,以及设备支持的CUDA功能和特性。这对于了解设备的硬件规格和功能非常有用。
4.安装tensorflow_gpu
1. 版本匹配问题,这里使用python3.7
代码语言:javascript复制python -m site
显示Python解释器搜索模块的目录列表,以及Python的安装信息和配置文件位置。
2. 安装命令
代码语言:javascript复制conda install tensorflow-gpu==2.3.0
亦可使用pip命令
3. 运行报错及解决方案
①报错
代码语言:javascript复制AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike'
改
②报错
2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
代码语言:javascript复制2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
这个报错信息表明你的TensorFlow二进制文件是经过优化的,使用了oneAPI Deep Neural Network Library (oneDNN)来在性能关键的操作中使用特定的CPU指令,包括AVX和AVX2。 然而,这个优化只适用于一些性能关键的操作,对于其他操作可能并没有启用这些指令。如果你希望在其他操作中也启用这些指令,你需要重新编译TensorFlow,并使用相应的编译器标志来启用AVX和AVX2指令集。
AVX(Advanced Vector Extensions-Intel® AVX) 是intel 优化CPU用于浮点计算的技术,如果有GPU了,其实不用考虑该警告讯息。 不过, 不管怎么说, 如果不愿意看到该警告讯息, 可以加上如下2行代码:
代码语言:javascript复制import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
该代码是用来设置TensorFlow的日志级别的。通过设置os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
,将日志级别设置为最低级别,即只显示错误信息,不显示其他日志信息。这可以帮助减少不必要的日志输出,使程序的运行输出更加简洁。
5.安装pytorch_gpu
查看版本匹配
Previous PyTorch Versions | PyTorch
https://pytorch.org/get-started/previous-versions/
10.1
1. pip安装
代码语言:javascript复制pip install torch==1.8.1 cu101 torchvision==0.9.1 cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
2. conda安装
代码语言:javascript复制conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch
11.7
代码语言:javascript复制conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia