可能原因:
- 没有安装CUDNN
- pytorch和cuda版本不对应。具体来说,是pytorch编译时cuda的版本和环境cuda版本不一致。
- 显卡和安装的CUDA及CUDNN版本不兼容。比如2080至少需要 cuda9.2及以上才可以较好运行。
- 内存不足,dataloder每次处理的数据过大
- 显存不足,OOM。有时候当程序调用cuDNN时遇到显存不足,此时可能不会报OOM,而会报cuDNN error
根据我的经验,如果在代码刚跑的时候就报cuDNN error,应该是前三种原因。
如果是运行一段时间之后再报错,应该是第4,5个原因。
https://blog.csdn.net/qq_44420246/article/details/108237097
https://www.cnblogs.com/naive-LR/p/14256624.html
https://github.com/pytorch/pytorch/issues/17543