1. libcudnn.so.x: file too short
解决办法: 删除软连接后重新建立新的软连接:
代码语言:javascript复制# 到cuda目录
# x为cuda版本
# 0.21 是文件的小版本号,可以在文件夹内找到文件名查看
cd /DATA/234/gxrao1/software/cuda-x.0/lib64
# 删除软连接
rm -rf libcudnn.so libcudnn.so.x
#修改文件权限,并创建新的软连接
chmod u=rwx,g=rx,o=rx libcudnn.so.x.0.21
ln -s libcudnn.so.x.0.21 libcudnn.so.x
ln -s libcudnn.so.x libcudnn.so
2. Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_INVALID_DEVICE
解决办法:指定运行GPU设备号
代码语言:javascript复制# x为gpu device id: 0,1,2,3
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "x"
3. (interrupted by signal 11: SIGSEGV)
并提示cudnn版本不对,需要更新cudnn的版本.例如tensorflow1.11版则需要cudnn7.21以后的版本.下载了7.3.0的版本并覆盖源文件,就好了. 可以需要重复1.中的步骤来重新建立软连接.