大家好,又见面了,我是你们的朋友全栈君。
【说在前面】
复杂的机器学习程序,特别是已经训练好跑的时候出的问题,不是说改CUDA就能改的。因为很多参数已经在另一个gpu里面了,单纯改一个test的代码是不够的。
如果是上述情况,只有查运行情况了,看看到底是什么程序占用了那么那么多的内存,可以的话kill掉就行。
报错如下
思路
简洁明了,他已经告诉你了,默认使用的那gpu内存不足。
在操作系统输入如下,查一下memory现在的状态:
nvidia-smi
复制
害,发现GPU-0有一个进程正在执行导致1GB剩余都不够。
我们用GPU-1执行就行啦!
问题解决
python文件中:
import os
复制
os.environ["CUDA_VISIBLE_DEVICES"] = '1'
复制
解决了。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127682.html原文链接:https://javaforall.cn