【2022超详细版】Win10安装cuda（10.1、11.7）+cuDNN（7.6.5、8.5.0）+tensorflow(gpu版)+pytorch（gpu版）

1.查看显卡支持的CUDA版本

查看版本

Release Notes :: CUDA Toolkit Documentation (nvidia.com)

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

根据数值选择相应cuda版本

2.安装CUDA

官网

从NVIDIA官方网站上下载适合你系统的CUDA Toolkit安装包。

CUDA Toolkit Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-toolkit-archive

10.1版本可全装其他盘，11.7版本会有2个多G固定装在C盘

10.1版本

1. 下载地址

CUDA Toolkit 10.1 original Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-10.1-download-archive-base?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal

2. 安装过程

根据CUDA Toolkit的安装向导，选择适合你的选项进行安装，可以根据你的需求进行自定义安装。

双击.exe进行安装

临时文件，安装后自动清除

默认C盘，建议更改到D盘如图所示目录，便于后续添加环境变量

3. 将CUDA的路径添加到环境变量中

安装完成，需要将CUDA的路径添加到你的系统环境变量中。在Windows操作系统上，可以通过右键点击"计算机"（或"此电脑"）-> 属性 -> 高级系统设置 -> 环境变量，在系统变量中找到"Path"变量并添加CUDA的安装路径。

新建如下环境变量，自己根据实际情况进行修改

代码语言：javascript复制

D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1libx64

D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1include

D:CUDANVIDIA GPU Computing ToolkitCUDAv10.1extrasCUPTlib64

D:CUDANVIDIA CorporationCUDA Samplesv10.1binwin64

D:CUDANVIDIA CorporationCUDA Samplesv10.1commonlibx64

(可选择新建，亦可选择“浏览”找到相应文件夹)

11.7版本与10.1有区别的部分

11.7安装过程可参照前文，这里仅介绍有区别的部分

1. 安装位置

缺NVIDIA Corporation的（2个多G）固定装在C盘

2. 默认添加环境变量

不需要手动添加环境变量

检验安装

代码语言：javascript复制

nvcc -V

代码语言：javascript复制

set cuda

卸载CUDA

卸载框选的4个：

3.下载cuDNN

CUDA10.1版本 cuDNN7.6.5

官网下载(需要先注册)cuDNN Archive | NVIDIA Developer

https://developer.nvidia.com/rdp/cudnn-archive

下载后，解压，然后将bin、include、lib文件夹下的文件直接复制到CUDA安装目录中的对应位置。

CUDA11.7版本 cuDNN8.5.0

检验是否安装成功

代码语言：javascript复制

bandwidthTest.exe

"bandwidthTest.exe"用于测试CUDA设备的内存带宽。运行此可执行文件将显示出设备的内存读取和写入带宽信息，以及带宽测试的结果。这对于评估设备的性能和了解其内存访问速度非常有用。

代码语言：javascript复制

deviceQuery.exe

"deviceQuery.exe"用于查询CUDA设备的属性和功能。运行此可执行文件将显示出设备的名称、计算能力、CUDA核心数量、内存总量、内存时钟频率等信息，以及设备支持的CUDA功能和特性。这对于了解设备的硬件规格和功能非常有用。

4.安装tensorflow_gpu

1. 版本匹配问题，这里使用python3.7

代码语言：javascript复制

python -m site

显示Python解释器搜索模块的目录列表，以及Python的安装信息和配置文件位置。

2. 安装命令

代码语言：javascript复制

conda install tensorflow-gpu==2.3.0

亦可使用pip命令

3. 运行报错及解决方案

①报错

代码语言：javascript复制

AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike'

改

②报错

2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

代码语言：javascript复制

2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations:  AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

这个报错信息表明你的TensorFlow二进制文件是经过优化的，使用了oneAPI Deep Neural Network Library (oneDNN)来在性能关键的操作中使用特定的CPU指令，包括AVX和AVX2。然而，这个优化只适用于一些性能关键的操作，对于其他操作可能并没有启用这些指令。如果你希望在其他操作中也启用这些指令，你需要重新编译TensorFlow，并使用相应的编译器标志来启用AVX和AVX2指令集。

AVX（Advanced Vector Extensions-Intel® AVX) 是intel 优化CPU用于浮点计算的技术,如果有GPU了，其实不用考虑该警告讯息。不过，不管怎么说，如果不愿意看到该警告讯息，可以加上如下2行代码：

代码语言：javascript复制

import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

该代码是用来设置TensorFlow的日志级别的。通过设置os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'，将日志级别设置为最低级别，即只显示错误信息，不显示其他日志信息。这可以帮助减少不必要的日志输出，使程序的运行输出更加简洁。

5.安装pytorch_gpu

查看版本匹配

Previous PyTorch Versions | PyTorch

https://pytorch.org/get-started/previous-versions/

10.1

1. pip安装

代码语言：javascript复制

pip install torch==1.8.1 cu101 torchvision==0.9.1 cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

2. conda安装

代码语言：javascript复制

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch

11.7

代码语言：javascript复制

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

pytorch cuda gpu win10 内存

0 人点赞