企业级显卡开启ECC导致可用显存少了一部分

2023-03-16 19:37:10 浏览数 (1)

执行nvidia-smi.exe,显示的显存差1G多,比如原本是24G显存,结果只显示了22G多。

直接说结论:开启ECC导致可用显存少了一部分,那部分用于支持ECC功能了。

Tesla系列GPU默认开启了ECC(error correcting code,错误检查和纠正)功能,该功能可以提高数据的正确性,随之而来的是可用内存的减少和性能上的损失。

关闭、开启各有利弊,一般不建议关闭--为了正确性

如果放弃保障正确性而单纯追求性能,那就关闭,看你自己

我自己的电脑是rtx2070 super显卡,8G显存,执行nvidia-smi.exe显示的显存是8192MB

执行nvidia-smi -q -d ecc查看ecc情况:

我电脑显卡不支持ecc

代码语言:javascript复制
nvidia-smi -q -d ecc

通过 nvidia-smi -i n -e 0/1 可关闭(0)/开启(1)第n号GPU的ECC模式,重启后该设置生效。

nvidia-smi -L 显示了一个显卡,即0号显卡

关闭ECC:nvidia-smi -i 0 -e 0

开启ECC:nvidia-smi -i 0 -e 1

可惜我电脑显卡不支持ecc,消费卡便宜有便宜的道理(企业卡贵有贵的道理--支持ecc啊)

参考:https://blog.csdn.net/sxjcXiaomin/article/details/78652924

https://www.nvidia.com/content/Control-Panel-Help/vLatest/zh-cn/mergedProjects/nvwksCHS/To_turn_your_GPU_ECC_on_or_off.htm

0 人点赞