环球观焦点:企业级显卡开启ECC导致可用显存少了一部分

来源:腾讯云 时间:2023-03-18 07:20:24

执行nvidia-smi.exe,显示的显存差1G多,比如原本是24G显存,结果只显示了22G多。


(相关资料图)

直接说结论:开启ECC导致可用显存少了一部分,那部分用于支持ECC功能了。

Tesla系列GPU默认开启了ECC(error correcting code,错误检查和纠正)功能,该功能可以提高数据的正确性,随之而来的是可用内存的减少和性能上的损失。

关闭、开启各有利弊,一般不建议关闭--为了正确性

如果放弃保障正确性而单纯追求性能,那就关闭,看你自己

我自己的电脑是rtx2070 super显卡,8G显存,执行nvidia-smi.exe显示的显存是8192MB

执行nvidia-smi -q -d ecc查看ecc情况:

我电脑显卡不支持ecc

nvidia-smi -q -d ecc

通过 nvidia-smi -i n -e 0/1 可关闭(0)/开启(1)第n号GPU的ECC模式,重启后该设置生效。

nvidia-smi -L 显示了一个显卡,即0号显卡

关闭ECC:nvidia-smi -i 0 -e 0

开启ECC:nvidia-smi -i 0 -e 1

可惜我电脑显卡不支持ecc,消费卡便宜有便宜的道理(企业卡贵有贵的道理--支持ecc啊)

参考:https://blog.csdn.net/sxjcXiaomin/article/details/78652924

https://www.nvidia.com/content/Control-Panel-Help/vLatest/zh-cn/mergedProjects/nvwksCHS/To_turn_your_GPU_ECC_on_or_off.htm

关键词:

推荐内容

Copyright 2000-2021 by www.jiaoyu.hnshkx.cn all rights reserved

备案号:沪ICP备2020036824号-8

邮箱 : 562 66 29@qq.com