【2022超详细版】Win10安装cuda(10.1、11.7)+cuDNN(7.6.5、8.5.0)+tensorflow(gpu版)+pytorch(gpu版)

2024-07-30 08:15:02 浏览数 (1)

1.查看显卡支持的CUDA版本

查看版本

Release Notes :: CUDA Toolkit Documentation (nvidia.com)

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

根据数值选择相应cuda版本

2.安装CUDA

官网

从NVIDIA官方网站上下载适合你系统的CUDA Toolkit安装包。

CUDA Toolkit Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-toolkit-archive

10.1版本可全装其他盘,11.7版本会有2个多G固定装在C盘

10.1版本

1. 下载地址

CUDA Toolkit 10.1 original Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-10.1-download-archive-base?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal

2. 安装过程

根据CUDA Toolkit的安装向导,选择适合你的选项进行安装,可以根据你的需求进行自定义安装。

  • 双击.exe进行安装
  • 临时文件,安装后自动清除

默认C盘,建议更改到D盘如图所示目录,便于后续添加环境变量

3. 将CUDA的路径添加到环境变量中

安装完成,需要将CUDA的路径添加到你的系统环境变量中。在Windows操作系统上,可以通过右键点击"计算机"(或"此电脑")-> 属性 -> 高级系统设置 -> 环境变量,在系统变量中找到"Path"变量并添加CUDA的安装路径。

新建如下环境变量,自己根据实际情况进行修改

代码语言:javascript复制
D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1libx64

D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1include

D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1extrasCUPTlib64

D:CUDANVIDIA CorporationCUDA Samplesv10.1binwin64

D:CUDANVIDIA CorporationCUDA Samplesv10.1commonlibx64

(可选择新建,亦可选择“浏览”找到相应文件夹)

11.7版本与10.1有区别的部分

11.7安装过程可参照前文,这里仅介绍有区别的部分

1. 安装位置

缺NVIDIA Corporation的(2个多G)固定装在C盘

2. 默认添加环境变量

不需要手动添加环境变量

检验安装

代码语言:javascript复制
nvcc -V
代码语言:javascript复制
set cuda

卸载CUDA

卸载框选的4个:

3.下载cuDNN

CUDA10.1版本 cuDNN7.6.5

  1. 官网下载(需要先注册)cuDNN Archive | NVIDIA Developer

https://developer.nvidia.com/rdp/cudnn-archive

下载后,解压,然后将bin、include、lib文件夹下的文件直接复制到CUDA安装目录中的对应位置。

CUDA11.7版本 cuDNN8.5.0

检验是否安装成功

代码语言:javascript复制
bandwidthTest.exe

"bandwidthTest.exe"用于测试CUDA设备的内存带宽。运行此可执行文件将显示出设备的内存读取和写入带宽信息,以及带宽测试的结果。这对于评估设备的性能和了解其内存访问速度非常有用。

代码语言:javascript复制
deviceQuery.exe

"deviceQuery.exe"用于查询CUDA设备的属性和功能。运行此可执行文件将显示出设备的名称、计算能力、CUDA核心数量、内存总量、内存时钟频率等信息,以及设备支持的CUDA功能和特性。这对于了解设备的硬件规格和功能非常有用。

4.安装tensorflow_gpu

1. 版本匹配问题,这里使用python3.7

代码语言:javascript复制
python -m site

显示Python解释器搜索模块的目录列表,以及Python的安装信息和配置文件位置。

2. 安装命令

代码语言:javascript复制
conda install tensorflow-gpu==2.3.0

亦可使用pip命令

3. 运行报错及解决方案

①报错

代码语言:javascript复制
AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike'

②报错

2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

代码语言:javascript复制
2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations:  AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

这个报错信息表明你的TensorFlow二进制文件是经过优化的,使用了oneAPI Deep Neural Network Library (oneDNN)来在性能关键的操作中使用特定的CPU指令,包括AVX和AVX2。 然而,这个优化只适用于一些性能关键的操作,对于其他操作可能并没有启用这些指令。如果你希望在其他操作中也启用这些指令,你需要重新编译TensorFlow,并使用相应的编译器标志来启用AVX和AVX2指令集。

AVX(Advanced Vector Extensions-Intel® AVX) 是intel 优化CPU用于浮点计算的技术,如果有GPU了,其实不用考虑该警告讯息。 不过, 不管怎么说, 如果不愿意看到该警告讯息, 可以加上如下2行代码:

代码语言:javascript复制
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

该代码是用来设置TensorFlow的日志级别的。通过设置os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2',将日志级别设置为最低级别,即只显示错误信息,不显示其他日志信息。这可以帮助减少不必要的日志输出,使程序的运行输出更加简洁。

5.安装pytorch_gpu

查看版本匹配

Previous PyTorch Versions | PyTorch

https://pytorch.org/get-started/previous-versions/

10.1

1. pip安装
代码语言:javascript复制
pip install torch==1.8.1 cu101 torchvision==0.9.1 cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
2. conda安装
代码语言:javascript复制
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch

11.7

代码语言:javascript复制
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

0 人点赞