infoROM is corrupted at gpu解决方法

2019-12-19 21:10:57 浏览数 (3)

一次玩游戏的时候突然感觉速度慢了很多,怀疑是显卡出了问题。

使用nvidia-smi指令查看显卡信息,发现在最后出现了infoROM is corrupted at gpu这样的警告。

这个警告未必意味着硬件问题,可以在软件端解决,所以我先直接给出解决方案:

  1. 尝试关闭现有的使用GPU的程序,再看一下有没有问题
  2. 如果还有问题,尝试重启,再看一下有没有问题
  3. 如果还有问题,请更新显卡驱动(找到电脑的NVIDIA Geforce Experience,或者鲁大师等都可以帮你更新驱动)

一些分析过程:

当时在百度上没有找到相关的帮助(因此我才要写这一篇),在bing上找到了仅有的一个相关帖子:

https://devtalk.nvidia.com/default/topic/1051405/cuda-setup-and-installation/inforom-is-corrupted-at-gpu/

情况虽有不同,但是注意到了其中一些论述:

Corrupted means the inforom did not pass some sort of sanity check (e.g. checksum). Therefore the GPU driver won’t use or trust its contents.

就是说因为没有通过一些安全检查,所以GPU没有使用一些内容。(所以我的游戏进程还能够使用GPU,但是性能差了很多)这是软件而非硬件问题。

提问者的解决方法是重启(果然几乎没什么是重启不能解决的)。

不过我尝试重启以后还是没有解决问题。

又注意到,那个帖子的分析中提出,这很可能是驱动程序的问题,故又更新显卡驱动,问题真的解决了!

不过后来又出现了一次问题,是在我用GPU跑深度学习程序的时候,发现推理速度很慢。结果发现又是这个问题。

首先更新了驱动,当下没有问题了。

然后我又重新跑了前面的实验,居然又发现了这个错误信息。

不过神奇的是,当我杀掉这个用GPU进程再测的时候,这个错误信息就没有了,并且后面再重跑也没有出现问题。

综上,虽然有点玄学,我总结了开头解决这个问题的3步,一般应该能够解决问题。

0 人点赞