一次玩游戏的时候突然感觉速度慢了很多,怀疑是显卡出了问题。
使用nvidia-smi
指令查看显卡信息,发现在最后出现了infoROM is corrupted at gpu
这样的警告。
这个警告未必意味着硬件问题,可以在软件端解决,所以我先直接给出解决方案:
- 尝试关闭现有的使用GPU的程序,再看一下有没有问题
- 如果还有问题,尝试重启,再看一下有没有问题
- 如果还有问题,请更新显卡驱动(找到电脑的NVIDIA Geforce Experience,或者鲁大师等都可以帮你更新驱动)
一些分析过程:
当时在百度上没有找到相关的帮助(因此我才要写这一篇),在bing上找到了仅有的一个相关帖子:
https://devtalk.nvidia.com/default/topic/1051405/cuda-setup-and-installation/inforom-is-corrupted-at-gpu/
情况虽有不同,但是注意到了其中一些论述:
Corrupted means the inforom did not pass some sort of sanity check (e.g. checksum). Therefore the GPU driver won’t use or trust its contents.
就是说因为没有通过一些安全检查,所以GPU没有使用一些内容。(所以我的游戏进程还能够使用GPU,但是性能差了很多)这是软件而非硬件问题。
提问者的解决方法是重启(果然几乎没什么是重启不能解决的)。
不过我尝试重启以后还是没有解决问题。
又注意到,那个帖子的分析中提出,这很可能是驱动程序的问题,故又更新显卡驱动,问题真的解决了!
不过后来又出现了一次问题,是在我用GPU跑深度学习程序的时候,发现推理速度很慢。结果发现又是这个问题。
首先更新了驱动,当下没有问题了。
然后我又重新跑了前面的实验,居然又发现了这个错误信息。
不过神奇的是,当我杀掉这个用GPU进程再测的时候,这个错误信息就没有了,并且后面再重跑也没有出现问题。
综上,虽然有点玄学,我总结了开头解决这个问题的3步,一般应该能够解决问题。